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An der Entwicklung des ZNS beteiligtes Protein (TP) 



Die vorliegende Erfindung betrifft ein Protein (TP) und dazu verwandte Proteine, 
die an der Entwicklung des Zentralnervensystems (ZNS) beteiligt sind und 
gewebe- und entwicklungsspezifisch exprimiert werden f die nachstehend be- 
schriebenen Varianten dieser Proteine sowie diese Proteine codierende DNA- 
Sequenzen. Die vorliegende Erfindung betrifft ferner gegen diese Proteine gerich- 
tete Antikorper oder Fragmente davon, sowie gegen die Expression dieser 
Proteine gerichtete Antisense-RNAs bzw. Ribozyme. SchlieSlich betrifft die 
vorliegende Erfindung Arzneimittel und Diagnoseverfahren, bei denen die vor- 
stehenden Verbindungen zur Anwendung kommen. 

Mutationen in Genen, die eine Rolle bei der Bildung und Aufrechterhaltung des 
Zentralen Nervensystems spielen, sind von grdfSter wissen- und wirtschaftlicher 
Bedeutung, da Erkrankungen am ZNS sehr haufig vorkommen, oft durch einen 
schweren, zum Teil todlichen Krankheitsverlauf gekennzeichnet sind und bisher 
nur sehr begrenzt therapierbar sind. Mit dem Anstieg der Lebenserwartung ist 
eine drastische Zunahme von neurologischen und psychischen Erkrankungen 
verbunden. Diese verursachen eine starke Einschrankung der Lebensqualitat der 
betroffenen Personen sowie erhebliche Kosten sowohl fur den Betroffenen als 
auch fur die Gesellschaft. 

Die Isolierung und Analyse ZNS-spezifischer Gene bietet eine gute Moglichkeit, 
Erkrankungen, wie z.B. Schizophrenic, Autismus, manische Depression und 
mentale Retardierungen untersuchen und schlieSlich auch behandeln zu konnen. 

Somit liegt der vorliegenden Erfindung das technische Problem zugrunde, Mittel 
bereitzustellen, mit denen Storungen bei der Entwicklung des ZNS, insbesondere 
solche, die mit einer Tumorentwicklung in Zusammenhang stehen, diagnostiziert 



25. Februar 1999 



- 2 - 

und gegebenenfalls therapiert werden konnen. 

Die Losung dieses technischen Problems wird durch die Bereitstellung der in den 
Patentanspruchen gekennzeichneten Ausfuhrungsformen erzielt. 

Gegenstand der vorliegenden Erfindung ist somit eine DNA-Sequenz, die ein 
Protein codiert, das an der Entwicklung des ZNS beteiligt ist und gewebe- und 
entwicklungssp'ezifisch exprimiert wird, wobei die DNA-Sequenz folgende DNA- 

Sequenzen umfalSt: 

(a) die DNA-Sequenz von Fig. 1, Fig. 2, Fig. 3, Fig. 4, Fig. 5, Fig. 6, 

Fig. 7 oder Fig. 8; 

(b) die DNA-Sequenz von Fig. 9 oder Fig. 10; 

(c) die DNA-Sequenz von Fig. 1 1 oder Fig. 12; 

(d) die DNA-Sequenz von Fig. 13; 

(e) die DNA-Sequenz von Fig. 14 oder Fig. 15 

(f) eine mit (a), (b), (c), (d) oder (e) hybridisierende DNA-Sequenz; 

(g) Varianten oder Fragmente der DNA-Sequenz von (a), (b), (c), (d), 
(e) oder (f); oder 

(h) eine DNA-Sequenz, die sich von der DNA-Sequenz von (a), (b), (c), 
(d), (e), (f) oder (g) aufgrund der Degeneration des genetischen 
Codes untersbheidet. 

Die vorliegende Erfindung beruht auf der Isolierung einer humanen DNA-Sequenz 
(Gen "T" oder T-Gen genannt; siehe die Figuren 1 -8, das das Protein TP codiert), 
wobei sich herausstellte, dafc das von dieser DNA-Sequenz codierte Protein vor 
allem im sich entwickelnden Zentralnervensystem (ZNS) benotigt wird. Dabei ist 
die Expression des dieses Protein codierenden Gens zeitlich im wesentlichen auf 
die Embryonalentwicklung und raumlich im wesentlichen auf Gewebe des ZNS 
beschrankt. Die Sequenzanalyse ergab, dafc es sich hierbei urn ein neues Gen 
handelt. Daruber hinaus konnten weitere Gene isoliert werden, die Homologien 
zu diesem Gen aufweisen (murines Gen "T", Figuren 9 und 10; Gen "12", 
Figuren 11 und 12; Gen "T3", Figur 13). Somit kann davon ausgegangen 
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werden, dafc diese Gene Mitglieder einer neuen, bisher unbekannten Genfamilie 
sind. Defekte in diesen Genen fuhren zu Einschrankungen der Funktionen des 
ZNS. Desweiteren (iben diese Gene eine wichtige Funktion bei der Kontrolle des 
Zellwachstums aus und Veranderungen in diesen Genen bzw. deren Expression 
fuhren zu Fehlern in der Kontrolle des Zellwachstums, beispielsweise auch zur 
Tumorbildung, insbesondere des Neuroblastoms. Von dieser Krebserkrankungen 
sind fast ausschliefclich kleinere Kinder bis ca. 8 Jahre betroffen. In 25 bis 30 
Prozent^ier Falle treten die ersten Anzeichen bereits innerhalb der ersten 12 
Lebensmonate auf . Beim Neuroblastom entarten sehr junge Zellen des autono- 
men Nervensystems. Da diese Nerven an der Ruckseite des Bauchraums und des 
Brustkorbes entlanglaufen, treten die meisten Neuroblastome im Bauch-, Becken- 
, Brust- Oder Halsbereich auf. Mehr als die Halfte der Erkrankungen gehen vom 
Nebennierenmark aus, welches auch von Nervenzellen gebildet wird. Zeichen, 
die beim Kleinkind auf ein Neuroblastom hinweisen konnen, sind Knoten, Schwe- 
llungen, Knochenschmerzen, Hinken, Mudigkeit, Fieber, Blasse, Schwitzen, 
hartnackiger Husten, Blutergusse urns Auge. Vom Arzt diagnostiziert werden 
kann ein Neuroblastom durch Blut-, Urin- und Ultraschalluntersuchungen sowie 
durch Entnahme von Biopsien aus dem Tumor und eine Knochenmarksunter- 
suchung. 1st der genaue Sitz der Geschwulst diagnostiziert, wird sie operativ 
entfernt. Problematisch ist die fruhe Bildung von Metastasen. Durch die Isolation 
und Analyse des T-Gens ist es nun moglich, neuartige Diagnose- und Therapie- 
maBnahmen fur das Neuroblastom zu entwickeln. Hierdurch wird es dann 
moglich, eine fruhzeitige Diagnose der Krebserkrankung durchzufiihren und 
Therapieformen zu etablieren, die verbesserte Heilungschancen verheiSen. 

Desweiteren fuhren Mutationen in T-Gen zu Entwicklungs- und Differenzierungs- 
storungen des ZNS, insbesondere des Gehirns. Dies fuhrt in vielen Fallen zu 
geistigen Erkrankungen, z.B. mentalen Retardierungen. Das T-Gen ubt auch eine 
wichtige Rolle bei der Verschaltung einzelner Gehirnareale, z.B. Vorder- und 
Mittelhirn, aus. Mutationen in diesem Gen fuhren in einigen Fallen zu schizophre- 
nen Erkrankungen oder Autismussyndromen. Mit Hilfe des humanen und murinen 
T-Gens konnen wichtige, prinzipielle Ruckschlusse auf die Entstehung des ZNS 
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und insbesondere des Gehirns gezogen werden. Hierbei bieten sich gute Ansatz- 
punkte f ur "die Erforschung krankhafter Veranderungen des ZNS und insbesonde- 
re des Gehirns. 

Mit Hilfe der genomischen Sequenzen konnen Patienten auf mdgliche Mutatio- 
nen hin einfacher untersucht werden. Die genomischen Sequenzen des T-Gens 
sind besonders dann von Vorteil, wenn wenig (Tumor)material fur die Analyse 
zur Verfugung steht. Hierdurch ist es beispielsweise moglich, schon kleinste 
Tumoren auf Mutationen in diesem Gen zu untersuchen. Weiterhin eroffnet es 
die Moglichkeit, eine Therapie (insbesondere Bestrahlungs- und/oder Chemo- 
therapie) auf ihren Erfolg hin zu uberprufen, da im Blut zirkulierende Tumorzellen 
mit genomischen Primern, die spezifisch fur die genomische DNA sind, durch 
eine PCR-Reaktion detektiert werden konnen. 

Der in der vorliegenden Erfindung verwendete Begriff "hybridisieren" bezieht sich 
auf konventionelle Hybridisierungsbedingungen, vorzugsweise auf Hybridis- 
ierungsbedingungen, bei denen als Losung 5xSSPE, 1% SDS, IxDenhardts- 
Losung verwendet wird und die Hybridisierungstemperaturen zwischen 35°C und 
70°C, vorzugsweise bei 65°C liegen. Nach der Hybridisierung wird vorzugsweise 
zuerst mit 2xSSC, 1 % SDS und danach mit 0,2xSSC bei Temperaturen zwi- 
schen 35°C und 70°C, vorzugsweise bei 65°C gewaschen (zur Definition von 
SSPE,SSC und Denhardts-Losung siehe Sambrook et al., Molecular Cloning: A 
Laboratory Manual, 2. Ausgabe, Cold Spring Harbor Laboratory Press, Cold 
Spring Harbor NY ( 1 989)) . Besonders bevorzugt sind stringente Hybridisierungs- 
bedingungen, wie sie beispielsweise in Sambrook et al ., supra, beschrieben 
sind. 

Die in der vorliegenden Erfindung verwendeten Begriffe "Varianten" oder "Frag- 
ment" umfassen DNA-Sequenzen, die sich gegenuber den in den Figuren ange- 
gebenen Sequenzen durch Deletion(en), Insertion(en), Austausch(e) und/oder 
andere im Stand der Technik bekannte Modifikationen unterscheiden bzw. ein 
Fragment des ursprunglichen Nucleinsauremolekuls umfassen, wobei das durch 
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diese DNA-Sequenzen codierte Protein noch die vorstehend erwahnten Eigen- 
schaften aufweist. Dazu zahlen auch Allelvarianten und SpleiSvarianten. Zwei 
ausgesuchte Beispiele von solchen Spleifcvarianten sind in den Fig. 14 und 15 
gezeigt. Verfahren zur Erzeugung der vorstehenden Anderungen in der Nuclein- 
sauresequenz sind dem Fachmann bekannt und in Standardwerken der Moleku- 
larbiologie beschrieben, beispielsweise in Sambrook et al. # supra. Der Fachmann 
ist auch in der Lage, zu bestimmen, ob ein von einer so veranderten Nucleinsau- 
resequenz codfertes Protein noch uber die vorstehend erwahnten Eigenschaften 
verfugt. 

in einer bevorzugten Ausfuhrungsform betrifft die vorliegende Erfindung eine 
DNA-Sequenz, die ein Protein codiert, das die Aminosauresequenz von Fig. 1 , 
Fig. 9, Fig. 11, Fig. 12, Fig. 13, Fig. 14 oder Fig. 15 umfafct, wobei das Protein 
die vorstehend definierte biologischel Aktivitat hat. 

Durch die Erniedrigung oder Hemmung der Expression der vorstehend beschrie- 
benen DNA-Sequenzen, kann die Synthese der von diesen codierten Proteine, 
beispielsweise des Proteins TP verringert oder eliminiert werden, was beispiels- 
weise bei bestimmten Krankheitszustanden wiinschenswert ist. Daher betrifft 
eine weitere bevorzugte Ausfuhrungsform der vorliegenden Erfindung Antisense- 
RNA, die dadurch gekennzeichnet ist, daS sie zu den vorstehenden DNA-Se- 
quenzen komplementar ist und die Synthese des von diesen DNA-Sequenzen 
codierten Proteins verringern oder hemmen kann und ein Ribozym, das dadurch 
gekennzeichnet, daG es zu einem Teil der vorstehenden DNA-Sequenzen und an 
die von diesen DNA-Sequenzen transkribierte RNA spezifisch binden und diese 
spalten kann, wodurch die Synthese des von diesen DNA-Sequenzen codierten 
Proteins verringert oder gehemmt wird. Vorzugsweise sind diese Antisense- 
RNAs und Ribozyme zu einer codierenden Region der mRNA komplementar. Der 
Fachmann ist in der Lage, ausgehend von den offenbarten DNA-Sequenzen, 
geeignete Antisense-RNAs herzustellen und anzuwenden. Geeignete Vorgehens- 
weisen sind beispielsweise in EB-B1 0 223 399 oder EP-A1 0 458 beschrieben. 
Ribozyme sind RNA-Enzyme und bestehen aus einem einzelnen RNA-Strang. 



25. Februar 1999 

• • • ••• 

- 6 - 

Diese konnen andere RNAs intermolekular spalten, beispielsweise die von den 
erfindungsgemafcen DNA-Sequenzen transkribierten mRNAs. Diese Ribozyme 
mussen prinzipiell iiber zwei Domanen verfiigen, (1) eine katalytische Domane 
und, (2) eine Domane, die zu der Ziel-RNA komplementar ist und an diese binden 
kann, was die Voraussetzung fur eine Spaltung der Ziel-RNA ist. Ausgehend von 
in der Literatur beschriebenen Vorgehensweisen ist es inzwischen moglich, 
spezifische Ribozyme zu konstruieren, die eine gewiinschte RNA an einer be- 
stimmten, vorgewahlten Stelle schneiden (siehe beispielsweise Tanner et al., in: 
Antisense Research and Applications, CRC Press, Inc. (1993), 415-426). 

Die erfindungsgemafcen DNA-Sequenzen bzw. die die vorstehend beschriebenen 
Antisense-RNAs oder Ribozyme codierehden DNAs konnen auch in einen Vektor 
bzw. Expressionsvektor inseriert werden. Somit umfafct die vorliegende Erfin- 
dung auch diese DNA-Sequenzen enthaltende Vektoren bzw. Expressionsvekto- 
ren. Die Bezeichnung "Vektor" bezieht sich auf ein Plasmid (z.B. pUC18, 
pBR322, pBlueScript), auf ein Virus oder ein anderes geeignetes Vehikel. In einer 
bevorzugten Ausfiihrungsform ist das erfindungsgemafce DNA-Molekul im Vektor 
mit regulatorischen Elementen funktionell verkniipft, die dessen Expression in 
prokaryontischen oder eukaryontischen Wirtszellen erlauben. Solche Vektoren 
enthalten neben den regulatorischen Elementen, beispielsweise einem Promotor, 
typischerweise einen Replikationsursprung und spezifische Gene, die die phano- 
typische Selektion einer transformierten Wirtszelle erlauben. Zu den regulatori- 
schen Elementen fur die Expression in Prokaryonten, beispielsweise E.coli, 
zahlen der lac-,trp-Promotor oder T7-Promotor, und fur die Expression in Eukary- 
onten der AOX1- oder GAL1 -Promotor in Hefe, und der CMV-,SV40-,RVS-40- 
Promotor, CMV- oder SV40-Enhancer fur die Expression in tierischen Zellen. 
Weitere Beispiele fur geeignete Promotoren sind der Metallothionein I- und der 
Polyhedrin-Promotor. Zu geeigneten Expressionsvektoren fur E.coli zahlen 
beispielsweise pGEMEX, pUC-Derivate, pGEX-2T, pET3b und pQE-8, wobei 
letzterer bevorzugt ist. Zu den fur die Expression in Hefe geeigneten Vektoren 
zahlen pYlOO und Ycpadl , fur die Expression in Saugerzellen pMSXND, pKCR, 
pEFBOS, cDM8 und pCEV4. Zu den erfindungsgemafcen Expressionsvektoren 
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zahlen auch von Baculovirus abgeleitete Vektoren fur die Expression in Insekten- 
zellen, beispielsweise pAcSGHisNT-A. 

Allgemeine, auf dem Fachgebiet bekannte Verfahren konnen zur Konstruktion 
von Expressionsvektoren, die die erfindungsgemaSen DNA-Sequenzen und 
geeignete Kontrollsequenzen ehthalten, verwendet werden. Zu diesen Verfahren 
zahlen beispielsweise in vitro-Rekombinationstechniken, synthetische Verfahren, 
sowie in^vivo-Rekombinationsverfahren, wie sie beispielsweise in Sambrook et 
aL, supra, beschrieben sind. Die erfindungsgemaSen DNA-Sequenzen konnen 
auch in Verbindung mit einer fur ein anderes Protein bzw. Peptid codierenden 
DNA inseriert werden, sodafc die erfindungsgemafcen DNA-Sequenzen beispiels- 
weise in Form eines Fusionsproteins exprimiert werden konnen. 

Die vorliegende Erfindung betrifft auch die vorstehend beschriebenen Vektoren 
enthaltende Wirtszellen. Zu diesen Wirtszellen zahlen Bakterien (beispielsweise 
die E.coli-Stamme HB101, DH1 , x1776, JM101, JM109, BL21 und SG13009), 
Hefe, vorzugsweise S. cerevisiae, Insektenzellen, vorzugsweise sf9-Zellen, und 
Tierzellen, vorzugsweise Saugerzellen. Bevorzugte Saugerzellen sind CHO-, 
VERO-, BHK-, HeLa-, COS-, MDCK, 293- und WI38-Zellen. Verfahren zur Trans- 
formation dieser Wirtszellen, zur phanotypischen Selektion von Transformanten 
und zur Expression der erfindungsgemaSen DNA-Molekule unter Verwendung 
der vorstehend beschriebenen Vektoren sind auf dem Fachgebiet bekannt. 

Die vorliegende Erfindung betrifft ferner von den erfindungsgemafcen DNA- 
Sequenzen codierte Proteine sowie Verfahren zur Herstellung der von den 
erfindungsgemafcen DNA-Sequenzen codierten Proteine. Dem Fachmann sind 
Bedingungen bekannt, transformierte bzw. transfizierte Wirtszellen zu kultivie- 
ren. Das erfindungsgemafce Verfahren umfa&t die Kultivierung der vorstehend 
beschriebenen Wirtszellen unter Bedingungen, die die Expression des Proteins 
(bzw. Fusionsproteins) erlauben (vorzugsweise stabile Expression), und die 
Gewinnung des Proteins aus der Kultur oder aus den Wirtszellen. Geeignete 
Reinigungsverfahren (beispielsweise praparative Chromatographic, Affinitat- 
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schromatographie, beispielsweise Immunoaffinitatschromatographie, HPLC etc.) 
sind allgemein bekannt. 

Eine weitere bevorzugte Ausfuhrungsform der vorliegenden Erfindung betrifft 
Antikorper gegen die vorstehend beschriebenen erfindungsgemaSen Proteine 
oder ein Fragment davon. Diese Antikorper konnen monoclonale, polyclonale 
oder synthetische Antikorper sein oder Fragmente davon. In diesem Zusammen- 
hang bedeutet der Begriff "Fragment" alle Teile des monoclonalen Antikorpers 
(z.B. Fab-, Fv- oder "single chain Fv"-Fragmente), welche die gleiche Epitop- 
spezifitat wie der vollstandige Antikorper aufweisen. Die Herstellung solcher 
Fragmente ist dem Fachmann bekannt. 

Vorzugsweise handelt es sich bei den erfindungsgemaSen Antikorpern urn 
monoclonale Antikorper. Die erfindungsgemaSen Antikorper konnen gemaS 
Standardverfahren hergestellt werden, wobei das von den erfindungsgemaSen 
DNA-Sequenzen codierte Protein oder ein synthetisches Fragment davon als 
Immunogen dienen. Verfahren zur Gewinnung monoclonaler Antikorper sind dem 
Fachmann bekannt und umfassen beispielsweise als ersten Schritt die Herstel- 
lung von polyclonalen Antikorpern unter Verwendung der erfindungsgemaRen 
Proteine oder Fragmente davon (beispielsweise synthetische Peptide) als Immu- 
nogen zur Immunisierung geeigneter Tiere, beispielsweise Kaninchen oder 
Huhner, und die Gewinnung der polyclonalen Antikorper aus dem Serum bzw. 
Eigelb. 

Dann werden beispielsweise Zell-Hybride aus Antikorper produzierenden Zellen 
und Knochenmark-Tumorzellen hergestellt und cloniert. AnschlieSend wird ein 
Clon selektioniert, der einen Antikorper produziert, der fur das verwendete 
Antigen spezifisch ist. Dieser Antikorper wird dann hergestellt. Beispiele von 
Zellen, die Antikorper produzieren, sind Milzzellen, Lymphknotenzellen, B-Lymp- 
hozyten etc.. Beispiele von Tieren, die zu diesem Zweck immunisiert werden 
konnen, sind Mause, Ratten, Pferde, Ziegen und Kaninchen. Die Myelomzellen 
lassen sich aus Mausen, Ratten, Menschen oder anderen Quellen erhalten. Die 
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Zellfusion kann man beispielsweise durch das allgemein bekannte Verfahren von 
Kohler unci Milstein durchfuhren. Die durch Zellfusion erhaltenen Hybridome 
werden mittels dem Antigen nach dem Enzym-Antikorper-Verfahren oder nach 
einem ahnlichen Verfahren abgesucht. Clone werden beispielsweise mit dem 
Grenz-Verdiinnuhgsverfahren erhalten. Die erhaltenen Clone werden beispiels- 
weise BALB/c-Mausen intraperitoneal implantiert, nach 1 0 bis 1 4 Tagen wird der 
Ascites der Maus entnommen, und der monoclonale Antikorper durch bekannte 
Verfahren (beispielsweise Ammoniumsulfatfraktionierung, PEG-Fraktionierung, 
lonenaustauschchromatographie, Gelchromatographie oder Affinitatschromato- 
graphie) gereinigt. 

In einer besonders bevorzugten Ausfuhrungsform ist der genannte monoclonale 
Antikorper ein aus einem Tier (z.B. Maus) stammender Antikorper, ein humani- 
sierter Antikorper oder ein chimarer Antikorper oder ein Fragment davon. Chima- 
re, menschlichen Antikorper ahnelnde oder humanisierte Antikorper besitzen eine 
herabgesetzte potentielle Antigenitat, jedoch ist ihre Affinitat gegeniiber dem 
Ziel nicht herabgesetzt. Die Herstellung von chimaren und humanisierten Antikor- 
pern bzw. von den menschlichen Antikorpern ahnelnden Antikorpern wurde 
ausfuhrlich beschrieben (siehe beispielsweise Queen et al., Proc. Natl. Acad. Sci. 
USA 86 (1989), 10029, und Verhoeyan et al., Science 239 (1988), 1534). 
Humanisierte Immunglobuline weiseh variable Grundgerustbereiche auf, die im 
wesentlichen von einem humanen Immunglobulin stammen (mit der Bezeichnung 
Akzeptor-lmmunglobulin) und die Komplementaritat der determinierenden Berei- 
che, die im wesentlichen von einem nicht-menschlichen Immunglobulin (z.B. von 
der Maus) stammen (mit der Bezeichnung Donor-lmmunglobulin). Die (der) 
konstante(n) Bereich(e) stammt/stammen, falls vorhanden, auch im wesentlichen 
von einem menschlichen Immunglobulin. Bei der Verabreichung an menschliche 
Patienten bieten humanisierte (sowie die menschlichen) Antikorper eine Reihe 
von Vorteilen gegenuber Antikorpern von Mausen oder anderen Spezies: (a) das 
menschliche Immunsystem sollte das Grundgerust oder den konstariten Bereich 
des humanisierten Antikorpers nicht als fremd erkennen und daher sollte die 
Antikorper-Antwort gegen einen solchen injizierten Antikorper geringer ausfallen 
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als gegen einen vollstandig fremden Maus-Antikdrper oder einen partiell fremden 
chimaren~Antik6rper; (b) da der Effektorbereich des humanisierten Antikdrpers 
menschlich ist, durfte er mit anderen Teilen des menschlichen Immunsystems 
besser interagieren, und (c) injizierte humanisierte Antikorper weisen eine Halb- 
wertszeit auf, die im wesentlichen zu der von naturlich vorkommenden mensch- 
lichen Antikorpern Equivalent ist, was es erlaubt, kleinere und weniger haufige 
Dosen im Vergleich zu Antikorpern anderer Spezies zu verabreichen. 

Die erfindungsgema&en Antikorper konnen beispielsweise zur Immunprazipitation 
der vorstehend diskutierten Proteine, zur Isolierung verwandter Proteine aus 
cDNA-Expressionsbanken oder zu den nachstehend offenbarten Zwecken (Dia- 
gnose/Therapie) verwendet werden. 

Die vorliegende Erfindung betrifft auch ein Hybridom, das den vorstehend 
beschriebenen monoclonalen Antikorper erzeugt. 

Die vorliegende Erfindung ermoglicht es, Storungen der Entwicklung des ZNS auf 
genetischer Ebene zu untersuchen, beispielsweise Tumorerkrankungen. Diese 
Diagnose kann nicht nur postnatal sondern bereits pranatal erfolgen. Mit einer 
erfrndungsgemalSen DNA-Sequenz bzw. davon abgeleiteten Sonden oder Primern 
kann in Saugern, insbesondere dem Menschen, festgestellt werden, ob sie ein 
Gen enthalten, das das erfindungsgemalSe Protein codiert und/oder exprimiert 
bzw. ob dieses Gen zu einer mutierten Form des Proteins fuhrt, die nicht langer 
biologisch aktiv ist. Dazu kann der Fachmann ubliche Verfahren, wie Reverse 
Transkription, PCR, LCR, Hybridisierung und Sequenzierung durchfuhren. Auch 
die erfindungsgemafcen Antikorper eignen sich fur die Diagnostik, d.h. beispiels- 
weise zum Nachweis des Vorhandensein und/oder der Konzentration des erfin- 
dungsgemafcen Proteins, einer verkurzten oder verlangerten Form des Proteins 
etc., in einer Probe. Die Antikorper konnen beispielsweise in Immunoassays in 
Flussigphase oder an einen festen Trager gebunden werden. Dabei konnen die 
Antikorper auf verschiedene Art und Weise markiert sein. Geeignete Marker und 
Markierungsverfahren sind auf dem Fachgebiet bekannt. Beispiele fur Immunas- 
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says sind ELISA und RIA. 

Somit betrifft die vorliegende Erfindung auch ein Diagnoseverfahren zum Nach- 
weis einer gestorten Expression des erfindungsgemafcen Proteins oder zum 
Nachweis einer veranderten Form dieses Proteins, bei dem man eine Probe mit 
den erfindungsgemafcen DNA-Sequenzen oder dem erfindungsgemaSen Antikor- 
per oder Fragment davon in Beruhrung bringt und sodann besipielsweise direkt 
oder indirekt bestimmt, ob sich die Konzentration des Proteins und/oder seine 
Aminosauresequenz im Vergleich zu einer aus einem gesunden Patienten gewon- 
nenen Protein unterscheiden. 

Die vorliegende Erfindung erlaubt auch die Durchfiihrung therapeutischer Mafc- 
nahmen bei den vorstehend diskutierten Storungen des ZNS, d.h. die vorstehend 
beschriebenen, erfindungsgemafcen DNA-Sequenzen, Antisense-RNAs, Ribozyme 
und Antikorper konnen auch zur Herstellung eines Arzneimittels, beispielsweise 
zur Kontrolle der Expression des erfindungsgemaSen Proteins oder zum Aus- 
tausch einer mutierten Form des Gens gegen eine funktionelle Form verwendet 
werden und somit auch zur Herstellung eines Arzneimittels zur Prevention oder 
der Behandlung von Erkrankungen des ZNS, insbesondere Tumorerkrankungen. 
Beispielsweise kann das erfindungsgemaBe Protein in Saugern, insbesondere den 
Menschen, durch ubliche Mafcnahmen eingebracht werden. Hierzu kann es 
gunstig sein, das Protein an ein vom jeweiligen Korper nicht als fremd angesehe- 
nes Protein, z.B. Transferrin oder Rinderserumalbumin (BSA) zu koppeln. Auch 
kann eine erfindungsgemafce DNA-Sequenz, Antisense-RNA oder Ribozym in 
Sauger, insbesondere den Menschen, eingebracht und exprimiert werden. Mit 
einem erfindungsgema&en Antikorper kann die Expression des erfindungsgema- 
Ben Proteins (TP) bzw. der verwandten Proteine kontrolliert und reguliert wer- 
den. 
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Somit betrifft die vorliegencle Erfinclung auch ein Arzneimittel, das die vorste- 
hend beschriebenen DNA-Sequenzen, Antisense-RNA, das Ribozym, den Ex- 
pressionsvektor, das erfindungsgemafce Protein oder den Antikorper bzw. das 
Fragment davon enthalt. Dieses Arzneimittel enthalt gegebenenfalls zusatzlich 
einen pharmazeutisch vertraglichen Trager. Geeignete Trager und die Formulie- 
rung derartiger Arzneimittel sind dem Fachmanh bekannt. Zu geeigneten Tragern 
zahlen beispielsweise Phosphat-gepufferte Kochsalzlosungen, Wasser, Emulsio- 
nen> beispielsweise Ol/Wasser-Emulsionen, Netzmittel, sterile Losungen etc. Die 
Verabreichung der Arzneimittel kann oral oder parenteral erfolgen. Zu den 
Verfahren fur die parenterale Verabreichung gehoren die topische, intra-arterielle, 
intramuskulare, subkutane, intramedullare, intrathekale, intraventrikulare, in- 
travenose, intraperitoneale oder intranasal Verabreichung. Die geeignete Dosie- 
rung wird von dem behandelnden Arzt bestimmt und hangt von verschiedenen 
Faktoren ab, beispielsweise von dem Alter, dem Geschlecht, dem Gewicht des 
Patienten, dem Stadium der Erkrankung, der Art der Verabreichung etc.. 

Vorzugsweise werden die vorstehend beschriebenen Nucleinsauren in einen fur 
die Gentherapie geeigneten Vektor inseriert und, beispielsweise unter Kontrolle 
eines gewebespezifischen Vektors in die Zellen eingeschleust. In einer bevorzug- 
ten Ausfuhrungsform ist der die vorstehend beschriebenen Nucleinsauren enthal- 
tende Vektor ein Virus, beispielsweise ein Adenovirus, Vaccinia-Virus oder 
Adenovirus. Besonders bevorzugt sind Retroviren. Beispiele fur geeignete Retro- 
viren sind MoMuLV, HaMuSV, MuMTV, RSV oder GaLV. Fur Zwecke der 
Gentherapie konnen die erfindungsgemaSen Nucleinsauren auch in Form von 
kolloidalen Dispersionen zu den Zielzellen transportiert werden. Dazu zahlen 
beispielsweise Liposomen oder Lipoplexe (Mannino et al., Biotechniques 6 
(1988), 682), 

Sch'lieBlich betrifft die vorliegende Erfindung einen diagnostischen Kit zur Durch- 
fuhrung des vorstehend beschriebenen Diagnoseverfahrens, der eine erfindungs- 
gemalSe DNA-Sequenz oder den vorstehend beschriebenen, erfindungsgemafcen 
Antikorper oder das Fragment davon enthalt. Je nach Ausgestaltung des diagno- 
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stischen Kits konnen die DNA-Sequenz bzw. der Antikorper oder das Fragment 
davon immobilisiert sein. 

Die Isolierung und Charakterisierung des menschlichen erfindungsgemaBen Gens 
und insbesondere der Maushomologe davon erlauben daruberhinaus die Etablie- 
rung eines Tiermodells, was fur das weitere Studium von Erkrankungen des ZNS 
auf molekularer Ebene sehr wertvoll ist. Gegenstand der vorliegenden Erfindung 
ist somit ferne'r ein nicht-menschliches Saugetier, dessen T-Gen verandert ist, 
z.B. durch Insertion einer heterologen Sequenz, insbesondere einer Selektions- 
markersequenz. 

Der Ausdruck "nicht-menschliches Saugetier" umfa&t jegliches Saugetier, 
dessen T-Gen verandert sein kann. Beispiele solcher Saugetiere sind Maus, 
Ratte, Kaninchen, Pferd, Rind, Schaf, Ziege, Affe, Schwein, Hund und Katze, 
wobei Maus bevorzugt ist. 

Der Ausdruck "T-Gen, das verandert ist" bedeutet, dafc in dem im nicht-mensch- 
lichen Saugetier naturlich vorkommenden entsprechenden Gen durch Standard- 
methoden eine Veranderung der Genstruktur oder der Gensequenz durchgefuhrt 
wird. Dies kann unter anderem durch die Einfuhrung einer Deletion von ca. 1-2 
kb, an dessen Stelle eine heterologe Sequenz, z.B. ein Konstrukt zur Vermittlung 
von Antibiotika-Resistenz (z.B. eine "neo-Kassette"), eingefuhrt wird, errercht 
werden. Desweiteren konnen heterologe Sequenzen in das T-Gen eingefuhrt 
werden, die es erlauben, in vivo zeit- und gewebespezifische Deletionen durch- 
zufuhren. Weiterhin konnen heterologe Sequenzen in das T-Gen eingefuhrt 
werden, die es erlauben, die Expression des T-Gens in vivo zu verfolgen. Dies 
kann unter anderem durch die Insertion einer fur das GFP (green fluorescent 
protein)-Protein codierenden Sequenz innrerhalb eines Exons oder als eigen- 
standiges Exon durchgefuhrt werden. Diese Methoden sind allgemein in Schwar- 
tzberg et al., Proc. Natl. Acad. Sci. USA, Vol. 87, S. 3210-3214, 1990 be- 
schrieben, worauf hier Bezug genommen wird. 
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Ein weiterer Gegenstand der vorliegenden Erfindung sind Zellen, die aus dem 
vorstehehden nicht-menschlichen Saugetier erhalten werden. Diese Zellen 
konnen in jeglicher Form vorliegen, z.B. in einer Primar- oder Langzeit-Kultur. 

Ein erfindungsgernaSes nicht-menschliches Saugetier kann durch ubliche Ver- 
fahren bereitgestellt werden. Gunstig ist ein Verfahren, das folgende Schritte 
umfaBt: 

(a) Herstellung eines DNA-Fragments, insbesondere eines Vektors, enthaltend 
ein verandertes T-Gen, wobei das T-Gen durch Insertion einer heterologen 
Sequenz, insbesondere eines selektierbaren Markers, verandert worden 
ist; 



(b) Preparation embryonaler Stammzellen aus einem nicht-menschlichen 
Sauger (bevorzugt Maus); 

(c) Transformation der embryonalen Stammzellen von Schritt (b) mit dem 
DNA-Fragment von Schritt (a), wobei das T-Gen in den embryonalen 
Stammzellen durch homologe Rekombination mit dem DNA-Fragment von 
(a) verandert wird, 

(d) Kultivieren der Zellen von Schritt (c), 

(e) Selektion der kultivierten Zellen von Schritt (d) auf das Vorhandensein der 
heterologen Sequenz, insbesondere des selektierbaren Markers, 

(f) Erzeugen chimerer nicht-menschlicher Sauger aus den Zellen von Schritt 
(e) durch Injektion dieser Zellen in Sauger-Blastocysten (bevorzugt Maus- 
Blastozyten), Ubertragen der Blastozysten in pseudo-schwangere weibli- 
che Sauger (bevorzugt Maus) und Analyse der erhaltenen Nachkommen 
auf eine Veranderung des T-Gens. 
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In Schritt (c) wird der Mechanismus der homologen Rekombination (vgl. R.M. 
Torres, R. Kiihn, Laboratory Protocols for Conditional Gene Targeting, Oxford 
University Press, 1997) ausgenutzt, um embryonale Stammzellen zu trans- 
fizieren. Die homologe Rekombination zwischen den in einem Chromosom 
vorhandenen DNA-Sequenzen und neuen, hinzugefiigten clonierten DNA-Sequen- 
zen ermoglicht das Einfiigen eines klonierten Gens in das Genom einer lebenden 
Zelle anstelle des urspriinglichen Gens. Mit dieser Methode kdnnen bei Verwen- 
dung enobryonaler Keimzellen via Chimaren Tiere erhalten werden, die fur das 
gewunschte Gen oder den gewiinschten Genteil oder die gewunschte Mutation 
homozygot sind. 

Der Ausdruck "embryonale Stammzellen" betrifft jegliche embryonalen Stamm- 
zellen eines nicht-menschlichen Saugetiers, die sich zur Mutierung des T-Gens 
eignen. Vorzugsweise sind die embryonalen Stammzellen von der Maus, ins- 
besondere die Zellen E1 4/1 oder 129/SV. 

Der Ausdruck "Vektor" umfafct jeglichen Vektor, der durch Rekombination mit 
der DNA Von embryonalen Stammzellen eine Veranderung des T-Gens ermog- 
licht. Vorzugsweise weist der Vektor einen Marker auf , mit dem auf vorhandene 
Stammzellen selektioniert werden kann, in denen die gewunschte Rekombination 
erfolgt ist. Ein solcher Marker ist z.B. die loxP/tkneo-Cassette, die mit Hilfe des 
Cre/loxP-Systems wieder aus dem Genom entfernt werden kann. 

Desweiteren kennt der Fachmann Bedingungen und Materialien, um die Schritte 
(a)-(f) durchzufiihren. 

Mit der vorliegenden Erfindung wird ein nicht-menschliches Saugetier bereitge- 
stellt, dessen T-Gen verandert ist. Diese Veranderung kann ein Ausschalten der 
Genexpression-regulierenden Funktion sein. Mit einem solchen Saugetier bzw. 
Zellen daraus kann selektiv die Genexpression-kontrollierende Funktion des TP- 
Proteins untersucht werden. Ferner ist es hiermit moglich, Substanzen, Arznei- 
mittel und Therapieansatze zu finden, mit denen selektiv auf die kontrollierde 
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Funktion eingewirkt werden kann. Daher liefert die vorliegende Erfindung eine 
Basis, urn auf die verschiedensten Erkrankungen einzuwirken. Solche Erkrankun- 
gen sind z.B. Einschrankungen der ZNS-Funktionen, die bis zu mentalen Retar- 
dierungen reichen oder die Induktion von Krebs durch Fehler bei der Kontolle der 
Zellproliferation. 

Die Erfindung wird weiter anhand der Figuren beschrieben, welche zeigen: 

Figurl: humane cDNA-Sequenz (Gen T) und abgeleitete Aminosaurese- 
quenz 

Figur 2: humane genomische DNA-Sequenz (Gen T) 
Figur 3: humane genomische DNA-Sequenz (Gen T) 
Figur 4: humane genomische DNA-Sequenz (Gen T) 
Figur 5: humane genomische DNA-Sequenz (Gen T) 
Figur 6: humane genomische DNA-Sequenz (Gen T) 
Figur 7: humane genomische DNA-Sequenz (Gen T) 
Figur 8: humane genomische DNA-Sequenz (Gen T) 

Figur 9: partielle murine cDNA-Sequenz (Gen T) und abgeleitete Amino- 
sauresequenz 

Figur 10: partielle murine genomische DNA-Sequenz (Gen T) 



Figur 1 1: partielle humane cDNA-Sequenz (Gen T2) und abgeleitete Amino- 
sauresequenz 





Figur 12: partielle murine cDNA-Sequenz (Gen T2) und abgeleitete Amino- 
sauresequenz 

Figur 13: partielle murine cDNA-Sequenz (Gen T3) und abgeleitete Amino- 
sauresequenz 

Figur 1 4: Splei&variante des humanen T-Gens mit abgeleiteter Aminosaurese- 
- quenz 

Figur 1 5: Spleifcvariante cles humanen T-Gens mit abgeleiteter Aminosaurese- 
quenz 

Folgende Clone wurden gemaS Budapester Vertrag bei der DSMZ (Deutsche 
Sammlung fur Mikroorganismen und Zellkulturen GmbH), Mascheroder Weg 1b, 
Braunschweig, am 18. August 1998 hinterlegt: 

Clon JFC277 (DSM 1 2371 ); humane cDNA; reprasentiert die 
humane cDNA-Sequenz von Bp 1218-3690 
Clon JFC405 (DSM 12372); humane cDNA; reprasentiert die 
humane cDNA-Sequenz von Bp 1-1891 

Clon JFC601 (DSM12373); murine cDNA; reprasentiert die 

murine cDNA-Sequenz von Bp 225-3026 

Clon JFC950 (DSM12374); humaner genomischer Clon; 

reprasentiert humane genomische Sequenz 

Clon JFC955 (DSM12375); humaner genomischer Clon; 

reprasentiert humane genomische Sequenz; beinhaltet Start 

der cDNA-Sequenz 

Clon JFC N21 1 2 (DSM1 2376); humaner genomischer Clon; 
wurde vollstandig sequenziert. Die Sequenz ist in Fig. 2 
gezeigt und enthalt die Sequenz von Bp 1756-4228 der 
humanen cDNA-Sequenz. 
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Am 2. Februar 1999 wurde folgender Clon gemalS Budapester Vertrag bei der 
DSMZ hiriterlegt: 

Clon JFC-BN27 (DSM 12659); enthalt die Sequenz von Bp 
4370-8690 der humanen cDNA-Sequenz 

Am 19. Februar 1999 wurde folgender Clon gemaR Budapester Vertrag bei der 
DSMZ hinterlegt: 

- ^ Clon JFC-BN20 (DSM 12698); enthalt die Sequenz von Bp 
2025-6280 der humanen cDNA-Sequenz 

Die in den Fig. 2-8 gezeigten Sequenzen entstammen den Klonen JFC955 (DSM 
1 2375) und JFC950 (DSM 1 2374). Die in Fig. 1 gezeigte Sequenz stammt aus 
den Clonen JFC277 (DSM 12371), JFC405 (DSM 12372) und JFC-BN27 (DSM 
12659) und JFC-BN20 (DSM 12698). Die in Fig. 9 gezeigte Sequenz stammt 
aus dem Clon JFC610 (DSM12373). 

Die Erfindung wird weiter anhand des nachfolgenden Ausfiihrungsbeispiels 
beschrieben. 

BEISPIEL 

Hinsichtlich der verwendeten Methoden wird auch auf Sambrook, J., Fritsch, 
E.F. und Maniatis, T. (Molecular cloning; a laboratory manual; second edition; 
Cold Spring Harbor Laboratory Press, 1 989) und Current Protocols in Molecular 
Biology (John Wiley and Sons, 1 994-1 998) hingewiesen, wobei die nachfolgend 
erwahnten Techniken, insbesondere Preparation von DNA bzw. RNA Oder 
Northern-Blot dem Fachmann hinreichend bekannt sind und beherrscht werden. 



Bevor die Durchfuhrung der Experimente im einzelnen beschrieben wird, soli im 
nachsten Abschnitt erst einmal die Arbeitsstrategie erlautert werden. 
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Auf der Suche nach Genen, die im mutierten Zustand Erkrankungen des ZNS 
(z.B. neurodegenerative Erkrankungen, mentale Retardierungen, Tumorerkran- 
kungen des ZNS) auslosen, wurden aus einer humanen fotalen Gehirn-cDNA- 
Bibliothek (Fa. Stratagene, Heidelberg) 23 cDNA-Klone isoliert. Eine humane 
fotale Gehirn-cDNA-Bibliothek wurde als Ausgangsmaterial verwendet, da davon 
ausgegangen wurde, daS in einer fotalen Gehirn-cDNA-Bibliothek Gene, die in 
der Entwicklung des ZNS und insbesondere des Gehirns eine Rolle spielen, 
vorhanden sind. Da aber auch sogenannte Haushaltsgene (Gene, die in den 
meisten Geweben exprimiert werden) im ZNS exprimiert werden, wurde nun 
getestet, ob die ausgewahlten cDNA-Klone von Genen stammen, die eine ZNS- 
spezifische Expression aufweisen. Hierzu wurden die In den einzelnen cDNA- 
Klonen enthaltenen cDNA-Stucke ('Inserts') isoliert und fur die Hybridisierung 
mit Northernblots verwendet. Die verwendeten Northernblots beinhalteten 
polyA-RNA aus verschiedenen menschlichen Geweben (z.B. Gehirn, Skelett- 
muskel, Leber und Niere) und verschiedenen Entwicklungsstadien (fotale und 
adulte Gewebe). Da, wie oben erwahnt, im fotalen Gehirn nicht nur gehirn- 
spezifische Gene exprimiert werden, wurde die Hybrdisierung mit den Northern- 
blots dazu verwendet, cDNA-Klone zu identifizieren, die vor allem im Gehirn 
exprimiert werden und weniger in anderen Geweben. Durch diese differentielle 
Analyse konnte ein cDNA-Klon identifiziert werden, der ein gehirnspezifisches 
Expressionsmuster aufweist. Unter Verwendung dieses cDNA-Klons konnte 
durch wiederholtes Hybridisieren der fotalen cDNA-Bibliothek die gesamte 
mRNA-Sequenz fur das darin codierte neue Protein isoliert und entschlusselt 
werden (Gen T mit darin codiertem Protein TP). 



Is. Titration der cDNA-Bibliotheken 

Um eine effektive Infektion zu gewahrleisten, war es zunachst notwendig, in 
einer Ubernachtkultur phagenkompetente Bakterien herzustellen. Die in dem 
Medium enthaltenen Magnesium-lonen induzieren den Maltose-Rezeptor der 
Bakterien, an dem der Phage bindet, um das Bakterium zu infizieren. 
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Durchfuhrung: 

50 fj\ E. cbli XL1-Blue in 50 ml LB-Medium ansetzen, wobei dem Medium MgS0 4 
in einer Konzentration von 10 mM zugesetzt wird. Bei 30°C und 220 rpm uber 
Nacht inkubieren. Abzentrifugieren der Bakterien bei 4°C und 1000 xg fur 10 
min. In 25 ml 10 mM MgS0 4 resuspendieren. Die so erzeugten phagenkomp- 
etenten Bakterien waren bei 4°C bis zu einer Woche lagerfahig. 

2. Ausplattieren der cDNA-Bibliotheken 

Zum Ausplattieren der Bibliothek muSten Baltimore Biological Lab. (BBL)-Agarpl- 
atten, und BBL-Top-Agarose vorbereitet werden. Die Phagen (humane bzw. 
murine cDNA-Bibliothek, Fa. Stratagene) wurden, um nach dem Ausplattieren 
Einzelplaques zu erhalten, mit SM-Medium 1:10 3 und 1:10 4 verdiinnt. 

Durchfuhrung: 

Fur den BBL-Agar (pH 7,2) werden 10 g BBL-Trypticase, 5 g NaCI, und 10 g 
Select Agar eingewogen und auf 1 I mit H 2 0 aufgefullt. Der Agar wird durch 
Autoklavieren gelost. Nach AbkCihlen auf ca. 60°C die Platten gieSen. Die 
Platten werden vor Gebrauch auf 37°C vorgewarmt, um ein vorzeitiges Ersta- 
rren der Top- Agarose zu vermeiden. Die BBL-Top-Agarose (pH 7,2) wurde mit 
10 g BBL-Trypticase, 5 g NaCI, 6,5 g Agarose und 10 ml 1M MgS0 4 -L6sung auf 
1 I H 2 0 angesetzt. Durch Autoklavieren losen und im Wasserbad auf 41 °C 
bereitstellen. 1 5 jj\ wie vorstehend angeben verdunnte Phagenlosung und 250 
jj\ der kompetenten XL-1 Bakterien in ein 15 ml Falcontube geben. 20 min. bei 
Raumtemperatur inkubieren. 10 ml BBL-Top Agarose zugeben, schwenken und 
auf die angewarmte Agarplatte geben. Nach ca. 20 min ist die Top-Agarose- 
Schicht fest, und die Platten konnen mit der Agarseite nach oben gestapelt 
werden. Die Inkubation erfolgt uber Nacht bei 37°C. Die Platten sind nach 
abgelaufener Inkubationszeit bei 4°C lagerbar oder konnen direkt zum Transfer 
der Phagenplaques verwendet werden. Zur Lagerung die Platten diese zusam- 
men mit einem chloroformgetrankten Tuch in Plastiksacken gut verschliefcen. 
Das Chloroform verhindert das Wachstum von kalteliebenden Bakterien und 
Pilzen. 
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In vivo Excision 



Die verwendeten cDNA-Banken (humane und murine fotale Gehirn-cDNA-Bibliot- 
hek; Fa. Stratagene, Heidelberg) waren in dem Vektor /l-ZAPII kloniert. Hierdurch 
bestand die Moglichkeit, die Subklonierung des Phageninserts in einen Plasmid- 
Vektor zu umgehen. Dieses Protokoll erlaubt es auf einfache Weise, cDNA, die 
sich als Insert im v4-ZAPII-Vektor befindet, durch einen in vivo Ansatz in ein 
Insert zu uberfiihren, das sich nun im Plasmid Blueskript SK(-) befindet. Das 
Prinzip dieses Ansatzes liegt darin, date durch einen Helferphagen Informationen 
fur Proteine eingebracht werden, die eine DNA-Amplifikation nur in dem Bereich 
des Phagengenoms erlauben, die die genetische Information fur das Plasmid mit 
cDNA-lnsert besitzen. Es wurde weitgehend nach dem Protokoll des Herstellers 
(Stratagene) verfahren. 

Insbesondere wurde so ausplattiert, dalS Einzel-Phagenplaques auf der Platte 
waren. Mit diesen Einzelplaques wurde dann das in-vivo Excisionsprotokoll 
durchgefuhrt. Aus den Bakterienklonen wurde die Plasmid-DNA und deren 
Plasmid-lnserts isoliert und anschlielSend mit Northern Blots hydridisiert. Die 
Auswahl der weiter zu untersuchenden Klone beruhte auf dem Expressions- 
muster bei den Northern Blots. 

Durchfuhrung: 

100 /j\ eines Einzel-Phagen vi-ZAPII-Klones mit 200 jj\ XL1-Bakterien und 2 y\ 
Helferphagen (im Stratagene-Kit enthalten) versetzen. 15 min. bei 37°C und 80 
rpm schutteln, wobei die spezifische Anlagerung beider Phagentypen an das 
Wirtsbakterium stattfindet. 3 ml LB-Medium zugeben. 2 h bei 37 °C und 200 
rpm inkubieren. Wahrend dieser Zeit findet die DNA-Replikation des im l-ZAPII- 
Vektors enthaltenen Plasmides, dessen Zirkularisierung, sowie die Verpackung 
in Hiillproteine und Ausschleusung aus dem Bakterium statt. Auf 70°C fur 20 
min. erhitzen. Im AnschluS 1 5 min. bei 4000g zentrifugieren. Dies totet die noch 
verbliebenen Bakterien ab und trennt deren Bruchstucke von den in der Phagen- 
hulle vorhandenen Plasmiden ab, die sich im Uberstand befinden. 1 jjI davon zu 
200 jj\ SOLR-Wirtszellen geben, 15 min. bei 37°C inkubieren. 100 jj\ auf LB/- 
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Amp-Platten ausplattieren. Uber Nacht bei 37 °C lagern. Die nun gewachsenen 
Bakterienklone enthalten das Plasmid mit dem entsprechenden cDNA-lnsert. Es 
wurde jeweils eine Mini-Prep-DNA-Praparation durchgefuhrt. 

4. "random primed" DNA-Markierunq 

Die radioaktive Markierung der doppelstrangigen Insert-DNA des cDNA-Klons 
wurde fur die vveitere Isolation von iiberlappenden cDNA-Klonen wie folgt 
durchgefuhrt. 

Durchfuhrung: 

Fur einen typischen Markierungsansatz 1 00 ng DNA in einem Volumen von 1 2 jj\ 
H 2 0 losen. 10 minutiges Erhitzen auf 95°C bewirkt die Denaturierung der DNA 
in Einzelstrange. Ansatz auf Eis lagern, urn eine Reassoziation der beiden kom- 
plementaren DNA-Strange zu verhindern. Den Reaktionsansatz durch 4 jj\ OLB 
(Oligo-labelling-buffer, 1 jj\ Klenow (1U) sowie 2,5 jjI a- 32 P- dCTP und 2,5 //I a- 
32 P-dATP komplettieren. Uber Nacht bei Raumtemperatur inkubieren. Wahrend 
dieser Zeit findet die Bildung des Komplementarstranges, ausgehend von den an 
einen Einzelstrang angelagerten Hexanucleotiden, durch das Klenow-Fragment 
der E. coli DNA-Polymerase I statt. Die radioaktive Markierung der DNA erfolgt 
durch den Einbau des a- 32 P-dCTP und des a- 32 P-dATP. 



5i Abtrennen von nicht-einqebauten radioaktiven Nucleotiden 

Die Abtrennung der nichteingebauten Nucleotide erfolgte mit Hilfe einer selbst 
gefertigten Sephadex G-50 Saule. Das Auftrennungsprinzip der Saule beruht auf 
der AusschluBchromatographie. Die kleineren nichteingebauten Nucleotide 
passen in kleine Poren des Saulenmaterials, wahrend die DNA von diesen ausge- 
schlossen bleibt. Das Volumen, in dem sich die Nucleotide bewegen konnen ist 
daher groBer als das Volumen, das der DNA zur Verfiigung steht. Tragt man nun 
ein Gemisch aus DNA und Nucleotiden auf die Saule, so lauft die DNA schneller 
als die Nucleotide durch die Saule. Dies erlaubt die Abtrennung der nichteinge- 
bauten Nucleotide. 
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Durchfuhrung: 

Eine Pasteurpipette wurde mit einem kieinen Glaskugelchen verschlossen. 
Auffullen der Pasteurpipette mit in Wasser geldstem Sephadex G-50 ("Fine") bis 
sich das Fullmaterial 5 cm unter der Oberkante der Pasteurpipette befindet. 2x 
Spiilen der Saule mit TE. Auftragen des obigen radioaktiven Markierungsan- 
satzes. Zugabe von 320 fj\ TE. Die Losung, die durch die Saule gelaufen ist, 
verwerfen. Eppendorf-Tube unter die Saule stellen. Zugabe von 350 //I TE. 
Auffangen der clurch die Saule gelaufenen radioaktiven Losung. 

(L Plaque-"blot" 

Der Plaque-"Blot" wurde fur die Analyse der cDNA-Bibliothek vorgenommen, um 
die in Phagenklonen befindliche cDNA der Hybridisierung zuganglich zu machen. 

Durchfuhrung: 

Eine beschriftete, markierte Hybond-N-Membran luftblasenfrei fur 1 min auf die 
Platte mit den Phagenplaques legen. Das Markierungsmuster wurde ubertragen. 
10 min auf mit Denaturierungslosung (0,5 M NaOH; 1,5 M NaCI) getranktes 
Whatmanpapier legen, die Plaque-Seite nach oben. 10 min. in 50 mM Phosph- 
atpuffer neutralisieren. Mit einem Phosphatpuffer-getrankten Kleenex-Tuch 
werden die verbleibenden Reste des Bakterienrasens mit leichtem Druck abge- 
wischt. Die Filter werden t>ei Raumtemperatur zum Trocknen ausgelegt. An- 
schlieBend wurden die Filter 1 h bei 90°C gebacken. 

7. Hybridisierung 

Die Hybridisierung beruht auf der Bindung komplementarer, einzelstrangiger 
Nucleinsauren. Dazu wurde die zu untersuchende DNA auf einer Membran 
immobilisiert und mit einer radioaktiv markierten Sonde hybridisiert. Die komple- 
mentare Bindung bleibt auch nach dem Abwaschen der unspezifisch adharenten 
Sonden erhalten und kann autoradiographisch sichtbar gemacht werden. Bei der 
Hybridsierung wurden einzelstrangige Molekule unter Salz- und Temperaturbedin- 
gungen inkubiert, die die Bildung von basengepaarten doppelstrangen begunstig- 
en. Einen entscheidenden Faktor bei der Assoziations- und der Dissoziationski- 
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netik stellen die Wasserstoffbruckenbindungen zwischen den Basen-paaren G-C 
und A-T dar. Die Hybridisierungsreaktion wird durch Veranderungen der Temper- 
atur gnd der Salz- und Probenkonzentration beeinfluSt. 

Durchfuhrung: 

Zunachst die DNA-Filter in Hybridisierungslosung (0,5 M NaPi (pH 7,2); 7% 
SDS; 0,2% BSA; 0,2% PEG 6000; 0,05% Polyvinylpyrrolidon 360000; 0,05% 
Ficoll 70000; 0,5% Dextransulfat) mit 0,1 ml/cm 2 bei 65°C prahybridisieren. 
Dazu die Filter in einer Kunststoffbox in einem Schuttelwasserbad fur die Dauer 
von mindestens 1 h bei 65 °C inkubieren. Die Prahybridisierungslosung verwer- 
fen. Die radioaktiv markierte Probe (s. oben 4. und 5.) mit 0,5 ml/cm Hybridisi- 
erungslosung (65 °C) auf die Filter geben. Die Aktivitat der Probe sollte 50 cpm, 
gemessen im Abstand von 40 cm, nicht unterschreiten. Die Hybridisierung 
erfolgt uber Nacht bei 65°C (humane cDNA-Bibliothek) oder 55°C (Interspezies- 
hybridisierungen Mensch-Maus und zur Isolation der homologen Gene). Die Filter 
zweimal 30 min mit etwa 500 ml Waschpuffer im Schuttelbad bei 65°C (55°C) 
waschen. Daran anschlieSend wurde eine Autoradiographie durchgefuhrt. 

8. Autoradiographie 

Die Filter wurden in Frischhaltefolie verpackt. Die Autoradiographie erfolgte bei - 
80°C in einer Rontgenkassette, die eine Verstarkerfolie aus Calciumwolframat 
enthielt. Die Exponierung dauerte je nach Starke des Signals 30 min bis einige 
Tage. 

Mit Hilfe der oben genannten Techniken konnte die komplette mRNA, die fur das 
Protein des Gens T codiert, isoliert werden. Desweiteren konnte unter der 
Verwendung von cDNA-Klonen dieses neu isolierten Gens T zwei weitere Gene 
(T2 und T3) isoliert werden, die mit diesem Gen ausgepragte Homologien 
aufweisen. Hierzu wurden wieder die oben erwahnten Techniken verwendet. Zur 
Isolation der verwandten Gene T2 und T3 wurde die Hybridisierungstemperatur 
auf 55°C erniedrigt. 
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Patentanspruche 

1. DNA-Sequenz, die ein Protein codiert, das an der Entwicklung des ZNS 
beteiligt ist und gewebe- und entwicklungsspezifisch exprimiert wird, 
wobei die DNA-Sequenz folgende DNA-Sequenzen umfalSt: 

(a) die DNA-Sequenz von Fig. 1, Fig. 2, Fig. 3, Fig. 4, Fig. 5, 
Fig. 6, Fig. 7 oder Fig. 8; 

(b) die DNA-Sequenz von Fig. 9 oder Fig. 10; 

(c) die DNA-Sequenz von Fig. 11 oder Fig. 12; 

(d) die DNA-Sequenz von Fig. 13; 

(e) die DNA-Sequenz von Fig. 14 oder Fig. 15; 

(f) eine mit (a), (b), (c), (d) oder (e) hybridisierende DNA-Se- 
quenz; v 

(g) Varianten oder Fragmente der DNA-Sequenz von (a), (b), (c), 
(d), (e) oder (f); oder~^ 

(h) eine DNA-Sequenz, die sich von der DNA-Sequenz von (a), 
(b), (c), (d),..(e), (f) oder (g) aufgrund der Degeneration des 
genetischen Codes unterscheidet. 

2. DNA-Sequenz nach Anspruch 1, die ein Protein codiert, das die Amino- 
sauresequenz von Fig. 1, Fig. 9, Fig. 11, Fig, 12, Fig. 13, Fig. 14 oder 
Fig. 1 5 umfa&t, wobei das Protein die in Anspruch 1 definierte bio- 
logische Aktivitat hat. 

3. Antisense-RNA, dadurch gekennzeichnet, dafc sie zu der DNA-Sequenz 
von Anspruch 1 oder 2 komplementar ist und die Synthese des von dieser 
DNA-Sequenz codierten Proteins verringern oder hemmen kann. 

4. Ribozym, dadurch gekennzeichnet, daB es zu der DNA-Sequenz von 
Anspruch 1 oder 2 komplementar ist und an die von dieser DNA-Sequenz 
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transkribierte RNA spezifisch binden unci diese spalten kann, wodurch die 
Synthese des von dieser DNA-Sequenz codierten Proteins verringert oder 
gehemmt wird. 

5. Expressionsvektor, die DNA-Sequenz nach Anspruch 1 oder 2 enthaltend 
oder die Antisense-RNA nach Anspruch 3 oder das Ribozym nach An- 
spruch 4codierend. 

6. Wirtszelle, die mit dem Expressionsvektor nach Anspruch 5 transformiert 
ist. 

7. Protein, das von der DNA-Sequenz nach Anspruch 1 oder 2 codiert wird 
und das an der Entwicklung des ZNS beteiligt ist und gewebe- und ent- 
wicklungsspezifisch exprimiert wird. 

8. Verfahren zur Herstellung des Proteins nach Anspruch 7, das die Zuch- 
tung der Wirtszelle nach Anspruch 6 unter geeigneten Bedingungen und 
die Gewinnung des Proteins aus der Zelle oder dem Zuchtmedium umfaSt. 

9. Antikorper, der gegen das Protein nach Anspruch 7 gerichtet ist, oder 
Fragment davon. 

10. Verwendung der DNA-Sequenz nach Anspruch 1 oder 2, der Antisense- 
RNA nach Anspruch 3, des Ribozyms nach Anspruch 4, des Expressions- 
vektors nach Anspruch 5, des Proteins nach Anspruch 7 oder des Anti- 
korpers oder des Fragments davon nach Anspruch 9 zur Prevention oder 
Behandlung von Erkrankungen des ZNS. 

1 1 . Verwendung nach Anspruch 10, wobei die Erkrankung des ZNS eine Tu- 
morerkrankung ist. 



1 2. Diagnoseverfahren zum Nachweis einer gestorten Expression des Proteins 
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nach Anspruch 7 oder zum Nachweis einer veranderten Form dieses 
Proteins, bei dem man eine Probe mit der DNA-Sequenz nach Anspruch 1 
oder 2 oder dem Antikorper oder dem Fragment davon nach Anspruch 9 
in Beruhrung bringt und sodann direkt oder indirekt bestimmt, ob sich die 
Konzentration des Proteins und/oder seine Aminosauresequenz im Ver- 
gleich zu einer aus einem gesunden Patienten gewonnenen Protein unter- 
scheiden. 

13. Diagnostischer Kit zur Durchfuhrung des Verfahrens nach Anspruch 14, 
der die DNA-Sequenz nach Anspruch 1 oder 2 und/oder den Antikorper 
oder das Fragment davon nach Anspruch 9 enthalt. 

14. Nicht-menschliches Saugetier, dessen naturlich vorkommendes T-Gen eine 
Veranderung der Genstruktur oder der Gensequenz aufweist. 

15. Nicht-menschliches Saugetier, wobei die Veranderung der Genstruktur 
durch die Einfuhrung einer Deletion, an dessen Stelle eine heterologe 
Sequenz eingefiihrt wird, erreicht wird. 

16. Nicht-menschliches Saugetier nach Anspruch 14 oder 15, wobei die 
heterologe Sequenz eine Selektionsmarkersequenz ist. 

17. Nicht-menschliches Saugetier nach Anspruch 14, 15 oder 16, wobei die 
Selektionsmarkersequenz Resistenz gegen Neomycin vermittelt. 

18. Verfahren zur Herstellung eines nicht-menschlichen Saugetiers nach einem 
der Anspruche 14-17 gekennzeichnet durch die folgenden Schritte: 

(a) Herstellung eines DNA-Fragments, insbesondere eines Vektors, ent- 
haltend ein verandertes T-Gen, wobei das T-Gen durch Insertion 
einer heterologen Sequenz, insbesondere eines selektierbaren Mar- 
kers, verandert worden ist; 

(b) Preparation embryonaler Stammzellen aus einem nicht-mensch- 
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lichen Sauger (bevorzugt Maus); 
(cj Transformation der embryonalen Stammzellen von Schritt (b) mit 
dem DNA-Fragment von Schritt (a), wobei das T-Gen in den em- 
bryonalen Stammzellen durch homologe Rekombination mit dem 
DNA-Fragment von (a) verandert wird, 

(d) Kultivieren der Zellen von Schritt (c), 

(e) Selektion der kultivierten Zellen von Schritt (d) auf das Vorhanden- 
- sein der heterologen Sequenz, insbesondere des selektierbaren 

Markers, 

(f) Erzeugen chimerer nicht-menschlicher Sauger aus den Zellen von 
Schritt (e) durch Injektion dieser Zellen in Sauger-Blastocysten 
(bevorzugt Maus-Blastozyten), Obertragen der Blastozysten in 
pseudo-schwangere weibliche Sauger (bevorzugt Maus) und Ana- 
lyse der erhaltenen Nachkommen auf eine Veranderung des T- 
Gens. 




An der Entwicklung des ZNS beteiligtes Protein (N21) 



Beschrieben werden ein Protein (TP) und dazu verwandte Proteine, die an der 
Entwicklung des ZNS beteiligt sind und gewebe- und entwicklungsspezifisch 
exprimiert werden, sowie diese Proteine codierende DNA-Sequenzen. Beschrie- 
ben werden ferner gegen diese Proteine gerichtete Antikorper oder Fragmente 
davon, sowie gegen die Expression dieser Proteine gerichtete Antisense-RNA 
bzw. Ribozyrhe. SchlieBlich werden Arzneimittel und Diagnoseverfahren be- 
schrieben, bei denen die vorstehenden Verbindungen zur Anwendung kommen. 
AuBerdem wird ein nicht-menschliches Saugetier beschrieben, dessen fur TP 
codierendes Gen verandert ist. 
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Humane genomische Sequenz 



1 


4GATCAGACTT 


TGAAGAGTGT 


TTGTACCATG / CTAAAGTTTA 


CAGAATTTAT 


51 


TCCTGCTCTT 


TGAGGGTGCA 


TTGCAAATCC 


AGGCTAGAGG 


GAGAGATACC 


101 


AGTTAGGAXA 


GTACAGCAAT 


ACTCTACTGG 


GAAATGGTGA 


GGTGTTTCGT 


151 


GAAGACAATG 


GCAACACAGA 


TGAAGACATG 


CAGATGGAGG 


AAATAAAGAT 


201 


CCAGTTGAGC 


TTGTTGGCCA 


GTTGGATAGA 


GGTTGAGGTT 


ATGCATGATG 


251 


GAGCAATCTA 


GGTTTTTGTC 


TTGGGTAGGT 


GTTTCCATGA 


TAGTACTCAG 


301 


AATGAATCAT 


ATAGTTG TAC 


AGGTTGAATC 


CCACCCATGT 


TTGCACAATA 


351 


GAGTGACTGT 


CTAGCTGAAA 


TCCAGATGAC 


ACTCTGTATG 


CTAAGCTATG 


401 


CTTCATGGAA 


CTGTATAAAG 


GCACTTGCTA 


CATAGGCTAG 


TGGCAGATCT 


451 


GGAAGTAACC 


TATATGGTAT 


ATAGGAAATG 


AGGTGGCTTT 


TGTATAAATC 


501 


CTACAGATAA 


ATTTCATTTC 


CTGATCCTAT 


TATTTTGACT 


CATGTTAGCC 


551 


CAAGAAGAGT 


ATTCAGTACT 


TCATATCCCT 


GAAGGTAAGA 


CAGAGTAGTA 


601 


TTAGATTCAC 


TATTTGGCAA 


ATAAAAGGGA 


TCAAGTCCTA 


AGATCAAGCT 


651 


GATGAATCAA 


CACCTCATAG 


GATATGTCCC 


AACCAATTAT 


ATGGCTTCCC 


701 


CTATAAATAA 


AATCTAGTTC 


TCTTCTCTGG 


AGAGGAACAG 


TGAAGAATAT 


751 


CATAACCTAT 


GCTACAAACT 


GCTTGAGTAG 


GAGCTACTTC 


TCTCCAAGGC 


801 


TTTATATCAT 


TCATTCTGGC 


AGGCCCCTCT 


GTTTGTTCTC 


ACCAGCTCCT 


851 


GGGAAATTTA 


TTTCTCCTCT 


AG TG AT AT AA 


AAGCTCTCTG 


TTTGAGATGA 


901 


AGGGCTGCCC 


AGTTTATCAG 


ATCTGTATTA 


GTCTGTTCTC 


AGGCTGCTAA 


951 


TAAAGACATA 


CCTGAGACTG 


AGTAATTTAT 


GAAGGAAAGA 


GGTTTAATTG 


1001 


ACTCACAGTT 


CCACATGGCT 


GGGGAGGCCT 


CACAATCATG 


G CG AAA G ACT 


1051 


AATAAGG AG C 


AAAGTCACAT 


CTTACATGGC 


TGCAGACAAG 


AGAGCATGTG 


1101 


CAGGGGAACT 


GCTCTCCATA 


AAACCATCAG 


ATCTTGTGAG 


ACTTGTTCAC 


1151 


TATTACAAGA 


ACAACAGACA 


GGAAAACCCG 


CCCCCTCAAT 


TCAATTACCT 


1201 


GCCACTGGGA 


CCCTCCCACA 


ACACATGGGG 


ATTATGAGAG 


CTACAATTCA 


1251 


AGATGAGATT 


TGGGTGGGGA 


TACCGCCAAA 


CCATATGAAG 


TTCTTTCTTT 


1301 


GTTACTGGGT 


ACCATATCCA 


TTCTGTTGAG 


GTTCTGAGCC 


TTTCCAGTTA 


1351 


CTGTAACTCC 


TCTATCTCCT 


GTCTGTGCTA 


AGACTCAGTG 


ACCTCTCTCT 


1401 


GCCTTGCTTC 


TGCTTTGTCC 


TGACCCTTTC 


TGTGCATGCA 


CTCACTCTAG 


1451 


TTTGCCCACG 


TGAGGTGAGA 


GATGGTCCAG 


ATTAGCAACA 


ACAATCTGTG 


1501 


GACTAAAATC 


CTCTTTAGGG 


AGGAAGCAAA 


ATTCAGATGG 


ATGTTACTAA 


1551 


ACAAAGCTCA 


GAAACAGAGA 


CCAGGGTGTG 


GGAAGTAAGG 


TAGTAGCCTG 


1601 


AGAGCAGCTG 


GCAGTGTTTT 


AGACCTGGAG 


GGAGGTTAGG 


TCATCAGCAA 


1651 


TGAGGAGACT 


GCCTGGAAAA 


TCCTAGAAAA 


TTAAGACATC 


TGGTCAGGCA 


1701 


AGGTCATATC 


ACCAGCACAC 


TTCCCTTTTC 


AAGTTGAATC 


CCTTTCCTCT 
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17 51 GTTAAGAGGA TTCAAGTGTC TTTCTTGCAT TTTGTCTTCT CTTCTATATC 
1801 CATGCTTGCA ATATAAGGAG ACAGCAGTTG GCTGTTTGTG CTAGAAAATA 
1851 - TAAATGGCCA TTTTGAAAGC ATGCCAGACA GGATCTGCGG CAAGTTTTCA 
1901 ATGTTACTGC TGCCATCTGT TGTTCTTCAG TGCTGGGATG TGAATCTCTT 
1951 GGCAAACATC TCTCTAATTC TGAACTATCT TTCACCCCCA TC TAG AG ATA 
2 001 TTCACTTACT GAAGTGCCTT TTTAAAGCAA TGTTCCTCAC CAAGGCGATG 
2051 TTCTGAATGT TTTAAAATGG AAGAATCTGG AATGTTTTTA TTATAATACA 
2101 TTTTGTATAT CCCAAAGCAA AAATCAATTT CTTCATGGTT AATACTTTTG 
2151 TAATTTTGTT TTTAATAATA TTTTCCTTTT AAATATAAGA AAT ATTTT AT 
2201 TGAATTAATA CTTTAATGTA GCTGTTTCAA GTAAGATAAA ACAGAACAGA 
2 2 51 TTAC.TGTTTT CAACCTTGTT CACAGTTAGC TC TGTAACTA AGTTGTTGAG 
23 01 CTTTATCTAA GCTTTTTTAT TTTTACATAA CGTTTCCCTT TTCACTTAAC 

23 51 CTTGAAATTA TAG TAATTTG GGAACTTCTA TTCCTCTGAA AG AG AAAGC T 

24 01 AATGCCAAAG ATATTTCAAG GGAGAAAGAA GGTTTTTAAA AGGAGAGACA 
2 451 ATTCAGCTCA GACTTAATAG CTGTGATTGC TATTTATTAA GCAGAACGCC 
2 5 01 TATAACTAAA TTCTCAGATA TCCAAAAAAC AGCCTGTACA TTCTCAAAAG 
2 551 TGAAGATTAC ACATTTTCTA AGTTAAGGTA AAAGTTTTGT CTCTGTAGCA 
2 6 01 TCTTACTGAT TTCTATCTTC TCATTCTGCC TTAATAATGT CACTAAATAA 
2 6 51 ATGTTTGATG CACTAATACA TGAATAAAAC TATTCATGGT AATGATTCTT 
27 01 • TAGAAACACA GCTAAGTTTT GTAATTTTGT TTTTTAAAAA TTAAAAATTT 
27 51 AAATATAAAA ATGTTTTTAA V AAGGCTTGAA TTTCTTGTTA AATG T AC AC A 
2 8 01 TTTTAAGTTG TAGGCTGTCT TTAAAAATAA TCTCTCCACA CACTGTAGTA 
2 851 TTTAAAACAT CATGATATTA C TATAAAA C A TCAACAAATA GGGCAGTGGA 

2 901 AAACATGGTA ATCACTAAAA ATGCTCACAT GTCATATATT AAGACTTGAT 
29 51 AAGTAAACCA CAATAATAAA TAGAAAAGAA ATAGTTGTCT AAAAAGGGAT 

3 001 TCTCACCTTT CAAACCTTAC CATAAAAATG GAATATAAAA GAAGGAAGAG 
3 051 GAGGAGAAAT CAAATTATAT CATAAAATTT TCTGGGCAAA AAT ATT AC AG 
3101 AAGAAAATAA GAAAGATTTA TGGAGTTGAC TGAAACATTT TTGAATCCTA 
3151 TACATAAAAA TATCGTTAAT TAAAAGGAAA AACAAAGAAA CAGATTTGGG 
3 2 01 AAATATTTGA AACTGGTTTT TTTTTAGCAT TTAAAAATGT AATACAAATG 

32 51 GATTATTTAA ACTCCATTGC AAAAA T AC AC AAAGGACATT GACAATGTCT 
3 3 01 GGAAATAAAA TTAGCTAAGT AAGTTATAGA AAAACTCAGT CTCACAATTT 

33 51 GACAAATGTA ACTGAAAACT ATTAATATAA TTAGTAACTA TTTTTACATG 
3 4 01 TCAAAATTTT TGAATTACTA AAGGAAACCA CAATGCCTGA AAGTATCCAG 
3 4 51 GGTTTTTTTT TTTTTTTATA ATATTGGCAC TGTCATATGG GTGGCAGGAA 

Fig. 2 (Forts. 1) 
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3501 


TTGAAGTGAT 


GTTGTTTCTT 


CAGTTATTAA 


GTTGCATCTG 


CAGTGTTTCA 


3551 


AATGTCCAAA 


ACCTGTGAGT 


CAGTAATTCT 


CTTTTTGTAT 


ATTTATCCTA 


3601 


ATACAATAAT 


TCTAAACATA 


ATCTCAATAT 


ATATGTACAA 


AGTTATTCAC 


3651 


TGCAGTGTTA 


CTTACAATAG 


TTAGAAAATT 


GTAAAATGCT 


TTATGCATCT 


3701 


TAAAATATAA 


ATTGTTGAAT 


ATATAATAGT 


CCATATGATA 


TAATTATATC 


3751 


ATTATTATAA 


ATAATGAATT 


AGAAAATAAT 


TTAAGAGCAT 


TAAAATAATT 


3801 


ATAAGGTAAT 


ATGAAGTGAA 


TGAATAATGT 


ACAGATACTA 


TAATCAGCAG 


3851 


AGTGTTAACT 


AGGTAAATTT 


TTATGTGTGT 


ATATACTACT 


TCCTAAAAAT 


3901 


G AC TTG AC AG 


AAATCATCAA 


AATGCTAATG 


GTGGTTACTT 


CTGGGTGGGA 


3951 


ATACAGATGA 


TTTACTTTGT 


TCCTTTTATG 


TATTTCTGCA 


CTGCCCAGTC 


4001 


TTCCACAGTG 


AGCATATATT 


GGTTTTTAAA 


TTTATATAAG 


ATGGAAAAAG 


4051 


ATACCAAATG 


GTCTTCAATG 


AATCCTGGAG 


TTAACTTTCA 


TGTGTGTCAT 


4101 


ATGTTATATT 


CTAAACTTAT 


CACAAATAGA 


AGACTTTAAA 


TCAACTTGTA 


4151 


CCTATTTCAA 


CTATATAACA 


GCATCTTTAA 


AATGAGCATT 


GAATTAAACT 


4201 


ACCAAAACCA 


ACCATCATGA 


GGATTATTCA 


AGTAATGTGT 


TTAAACAAAA 


4251 


GAATTTGTAA 


TAAAATTACT 


TTATCTCCTT 


TGTGATTTCA 


GCCCATTTAA 


4301 


AAAAAATAGA 


TGTTTCTACT 


CTCCTTCAGA 


TATCATTAAA 


ACATAAACTT 


4351 


GTGCCTGACT 


GCATAAATCC 


CTTTTAAACT 


AATATCACTT 


ATTACGTTTA 


4401 


ACTAAGTCTA 


CCTAGGGCTT 


CCTTGTATAA 


AGAACAAGAG 


CTTTCCATTT 


4451 


TTTGTTTACC 


TAGCCCTTTC 


TGATGCCACG 


ACAGAATAGC 


TGTAAATCTT 


4501 


CATTATTTAT 


ATTCTAGAGA 


AAATAAAAGC 


AAATAAAAAG 


GTCAGTGTAT 


4551 


AAAG TTTATT 


GGTTGTTCTC 


TTTACTCAAA 


ACCCACATGG 


TATTAATG TT 


4601 


AGTCTCTATG 


AATATTTCAT 


GGATAAAATC 


AGAGCATTAA 


GTGCATACTA 


4651 


AAAACAATAA 


GAATGGAAAG 


ACTTTAACCT 


TATG TTTAT A 


TGAATTTCTA 


4701 


GGTTATCAAG 


AAGTTTATAG 


GCTATAGGCT 


AT AAAG TC TT 


AGGCTATGAT 


4751 


ATAGTAACCT 


AATGTAGACT 


TCCCTTGATA 


CATGAAAATA 


ATGGTACTAA 


4801 


GTACAAACAG 


AAGATGAGCT 


TAAAATTATT 


CTTTGAGTCC 


TCTTGATGGA 


4851 


TTTTTTCCCC 


CACACTTTCC 


CCAAAATTGT 


TTTATGCCTA 


TATTGTAGGA 


4901 


GACCATGCAA 


GAGACCTAGA 


GTCTCTTTTT 


CTTTCATCAC 


TTTCCAATCA 


4951 


ACAGCAAATC 


CTATCATTTT 


TACCACAAAA 


TATATCTTGA 


AACTCCCTTC 


5001 


TTTTGATTTA 


CTTGTAACTC 


CCCATCAAAA 


ACTGAAGAGT 


GTCACAATAC 


5051 


TTCATTAAGT 


TCCCTACTTG 


CACTCTACCT 


TTAATATATT 


TGTAGCACTA 


5101 


AAATG TTTTT 


AAAACATATA 


TCTGCTTATG 


TCATTTTACT 


GCTCAATACT 


5151 


ATCTGATTTT 


CTATTGCACT 


TCTAAGATAC 


TCTAATTTCT 


TAGCACTCTA 


5201 


T AT AAAATC C 


TTTAAGGGCT 


TCCCTGCTCA 


CCTTTTCAGA 


CTCAGAACTA 


5251 


TGTATTTCCT 


TTTGCCTGCT 


GTACTTGTAC 


CACTGGATTC 


TTGATTTTTG 



Fig. 2 (Forts. 2) 
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5301 


TTACTTCCAG 


G TTTTT AC AC 


TTATTTTTAC 


AATAAATGTG 


AAATACCCTT 


5351 


TTTGACAATA 


TCTACAAATA 


TTTCTTATTT 


GTCTTTATTG 


CTCTTTCCTG 


5401 


TAATGTTTAG 


TCTTCATTTT 


CCTGATAATG 


GCTATCTAAA 


GTTATCTCCT 


5451 


CAAAGAAGCA 


GTTATTTATT 


CACCCAAATC 


TTCTAGTCCT 


TCTCTGGAGT 


5501 


TTTCTTCTCA 


CTTCATTCCC 


TTGG TTTTTG 


CCACAATTTG 


TAATAATTTG 


5551 


CAATTTGGAG 


TGTTAGAATG 


AGGGAATAAA 


TCACAGGTAA 


TGACTATAGT 


5601 


TTGTGACTAT 


GTAAGATTGG 


ATTCGTTATT 


GATTTATTCC 


ACAAACACTG 


5651 


AGGCACTGCA 


TTTAGCCAAA 


TGCCAATCTT 


GGGCAGTGAG 


ACTCTGAAAG 


5701 


AGAATCTGCT 


TCCCCCACCA 


TAAACTACAA 


AGTGAAACAA 


CTCAGAATGT 


5751 


ACATAAATTA 


CAGAATGAAA 


GCACACTAGA 


AG TAAAC AC A 


GATGTGGAAG 


5801 


AGGTAAAGTG 


TCCTTGAAAA 


TCATGGAAAG 


ATTCATAAAG 


GGAATGACAT 


5851 


TTCAACTGGA 


TTCTAAACCA 


GTTATTCAAG 


CTCCACAAGG 


TTGC AC AG TA 


5901 


AATGAGCAGT 


GGCAGGATGA 


CATACCTTAG 


AAAGTAAAAG 


GAATCTTTTT 


5951 


TAAACTGCTA 


TAAAAATC AT 


TACATATACA 


TTTTGTAGGT 


CGAGAGTAAG 


6001 


GTATTTAACA 


TAAAATCATT 


TTAGTATATC 


AGTGTTTATA 


TAGACTTAGG 


6051 


TTTTTCTCAT 


TTAAAACCTC 


TTTTAATGAC 


TTGTGCTTTT 


CTTCATGGTA 


6101 


ATAAAACATT 


TTCCCAGGAA 


GTGCTGAATA 


AATCTTTCTT 


GAAATACGTT 


6151 


TTATTGCTTT 


CTATCAATGA 


CCCTGAAGTA 


ATACAGAATT 


TACACTTCAG 


6201 


CGGTTGCAAT 


GCTCAAACTT 


GACAGGTAAT 


GCACTGTGTT 


TGCTGATATA 


6251 


AGAGGTATGA 


TGTAGGGCTA 


AGTGGTTTTG 


TGCTCATTTA 


GCTTTCAGGA 


6301 


GAAAATAATT 


GACTTAACAT v 


TTTGATACTA 


AAACCCAAAG 


CCTAACAGTT 


6351 


AATTCTTGGT 


ATTTTAAATT 


ATTATTGCAA 


AGATTATTGT 


GCCGAATAAT 


6401 


ATGAAAATAT 


TTTATATAAT 


ATTTAAAAAG 


TATATCTCTT 


TCTTGGTATT 


6451 


ATTTAAATTA 


CCATAAAAAT 


GTGCGAAAAA 


GTTATACTGA 


AATG TG AT AG 


6501 


GATCTTTTAA 


AAGTGGTGCC 


TTGATTTTGT 


TAAGTGTTAC 


CTAGTTTTCC 


6551 


TCTGAAAACA 


AGAAACATAC 


CCAGAAGTTT 


TCACGAAATG 


GTCTCATGAA 


6601 


TATCTAAGGT 


TAGTCCGTAG 


TCTCATCTGA 


GACAAGGAAA 


GTCCCTTCCA 


6651 


CTATGAGCCT 


GTAAAATCAC 


AAGCAAGCTA 


GTTACTTCCT 


AG ATA C AATG 


6701 


GGAGTACTGG 


TATTGGGTAA 


ACACAGCTGT 


TTCAAATGGG 


AGAAATTGGC 


6751 


CAAAATTAAT 


GGGTTACAGG 


GCATGCAATT 


CCGAAATCCA 


TCTGGGCAGT 


6801 


CAAATTGTAA 


AAC T C C AAAA 


TGATXTCTTT 


TGACTCCATG 


TXTCACATCC 


6851 


AGGACATGCT 


GAXGCAAGAG 


ATAGGTTCCC 


AT AAT C TT TG 


GCAGCTCTGC 


6901 


CCCTGTGGCT 


TTGCAGGGTA 


TATCACCCCT 


CCCAGCTGCT 


TTCACAGGCT 


6951 


GGCATTGAGT 


GTCTGTGGCT 


TTCCCAGGAA 


CAAGGTGCAA 


GCTGTTGGTG 


7001 


GATCTACCAT 


TCTGGGGTTT 


GGAGGATGAT 


GGCCCTCTTC 


TCATAGCTCC 



Fig. 2 (Forts. 3) 
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7051 


ACTAGGCCGT 


GCTCCAGTAG 


AGACTCTGTG 


GGGGCTCTGA 


CCCCAGATTT 


7101 


CCCTCCTGCA 


CTGCCCTAGC 


AGAGATTCTT 


CATGAGGGCC 


GTGCCCCTGC 


7151 


AGAAAACTCT 


TTCCTGGGCA 


TCCAGGCATT 


TCCA/TACATC 


TGAAATCTAG 


7201 


GTGGAGGTTC 


CCAAACCTCG 


ATTCTTAATT 


TCTGTGCACC 


TGCAGGCTCT 


7251 


t CTACC ACGTG 


GAAGCTGCCA 


AGGTTTGGGG 


CTTGCACCCT 


CTGAAACCAC 


7301 


AGGCTGAGCT 


ATACCTTGGC 


CCCTTTTAGC 


AATGGCTGGA 


GTGACTGGGA 


7351 


CACAGGGCAC 


CAAGTCTCTA 


GGCTGCACAC 


AGTATGGGCA 


CCCTGGGCCC 


7401 


AGCCCTCAAA 


ATCATTTTTT 


CCTCCTAGGC 


TTCTGGATCA 


GTGAAGGGTG 


7451 


GGGCTGCCAT 


GAAGACCTA/T 


GACATGCCCT 


GGAGACATTT 


TCCCCATTGT 


7501 


CTTGGGGATT 


AACACTGGCT 


CCTTGTTACT 


TATGCAGATT 


TCTGCAGCCA 


7551 


GCTGAATTTC 


TCCTCAAAAA 


ATGGGTTTTT 


CTTTTCTACT 


GCATTGTCAG 


7601 


GCTGCAAATT 


TTCTGAACTT 


TTATGCTGTT 


TCCCTTTTAA 


AATGCGATGC 


7651 


TCTAACAACA 


CCCGTCACCT 


CTTGAATGCT 


TTGCTGCTTA 


GAAATTTCTT 


7701 


CTGTCAGATA 


CCCTAAATCA 


TCTCTCTCAA 


GTTCAGAGTT 


CCACAAATCT 


7751 


CTAGGGCAGG 


GGCAAAATGC 


CACCAGTCTC 


TTTGCTAAAA 


CATAACAAGA 


7801 


GTCGCCTTTG 


CTCCAGTTCT 


CAGCAAGTTC 


CTCATCTCCA 


TC CG AG AC AA 


7851 


CCTCAGCCTG 


GTCCTTATTG 


TTTATATCAC 


TATAAAAATT 


TTTGTCAAAG 


7901 


CCATTCAACA 


AGTCTCTACT 


CCAAACTTTC 


CCACATTTTC 


CTGTCTTCTT 


7951 


CTGAGCCCTC 


CAAATTGTTC 


CAGCCTCTGC 


CTGATACACA 


GTCCCAAAGT 


8001 


TACTTC C AC A 


TTTTTGGATA 


TCTTTTCAGC 


AATGCCCCGC 


TCTACTGGTA 


8051 


CCAACTTACT 


TTGTTAGTCC 


GTTTTCACAC 


TG TTG AT AAA 


GACATACCCA 


8101 


AGACTGGAAA 


GAAAAAAAGG 


TTTAATTGGA 


CTTACAGTTC 


CACATGGCTA 


8151 


GGGAGGCTTC 


ACAATCATGG 


CAGGAGGCAA 


AAGGCATTTC 


TTACATGATG 


8201 


GCAGCAAGAG 


AAAATGAGGA 


AGATGCAAAC 


GCAGAAATCC 


CTGATAAAAC 


8251 


CATCGGACCT 


TGTAAGACTT 


ATTCACTACC 


ACTAGGACAG 


TATGGGTGAT 


8301 


ACCACCCCCA 


TGATTCAAAT 


GATCTCCAAC 


CAGGTGCCTC 


CCACAACACA 


8351 


TGGGAATTAT 


GGGAATACAA 


TTCAAGATGA 


GATTTGGGTA 


GGGACACAGA 


8401 


GCCAAACTAT 


ATCACATGGA 


TTTCTTATAC 


^TTTGCTTTT 


AATAACACAA 


8451 


ACAAAAAAAT 


ACATCATTAA 


AAGGTTAGAA 


GTGAGAAGGT 


GTTTTTATGG 


8501 


AAATCAAAAA 


TAATATCACC 


TTAGTGAACA 


GTATTCTTAT 


GATTGTAGTT 


8551 


GAATTAGAGA 


GCAGAATACA 


TCTAGAAGAT 


TCAGTAGTAA 


GCATGTTTCT 


8601 


TCGATTAATG 


GAAAATTTGA 


ATAGCCTAGC 


TGATTGAGAT 


TGAGGTTACT 


8651 


ATTAAATGCC 


TGAAGTATAA 


GAGTTGGTTG 


TTTATGTAAA 


CAAAATATCT 


8701 


GTTTTACATG 


TACATGTGTA 


AGTAGGACTG 


TTGAGCCCCA 


GTAACATGAA 


8751 


ATATCAAAGA 


GCATGACTCG 


AATACCTGCC 


ATATGAAGTG 


CTATTACATC 


8801 


AAAAAAGAGG 


CGTGTGCTGA 


AAAATTACCT 


ACAAATGGCA 


TTTTCCTCAA 



Fig. 2 (Forts. 4) 
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8851 


ATCAATTTTA 


AATCTTCAGA 


ATTTCATTTT 


AATAATTGTT 


TAGTTAATAT 


8901 


TTCAGAATCC 


CTCATCATAA 


AAAGCAGGCA 


AAAGGCAAAA 


GTCCTTGAAT 


8951 


GTATAACACA 


TTTGTTTTCA 


AACAAGCCTG 


CCTCTAACTG 


TGAATCCAGG 


9001 


AGTGAATCCA 


GAACTACAAA 


TTAACTAAGA 


TTGGCCCCAT 


CGAGTTACTG 


9051 


AACGTTAAAA 


ATCTAAAAAC 


TAAAAGGCAT 


. GCCTCAACAA 


TTATTTTCTT 


9101 


CTTGGAATCA 


TTAATTAACC 


TATGTGTATC 


CAAACAATAA 


TCTTCCAGCA 


9151 


GTTTCGCTAG 


CTACATTTTT 


AATTACTTAA 


TATCATGTAA 


AATTTGTTTT 


9201 


ATTATTGTTC 


AGTTCTGAAT 


TTTGACATAT 


GCATCAAGCC 


ATGCAACTGC 


9251 


TACCACAGTC 


TTCCTGATCA 


CTGATCTGTT 


CTAAATCTCT 


ATAGCATTTT 


9301 


TCCTTTTCTT 


AAATGTTGCA 


TAAATAAAAC 


CATACCTTAT 


GTGGCCTTTT 


i 9351 


GAATCTGGCA 


TCTTTAACTT 


AATGCGCTTG 


AAATTAATCT 


ATGTCATTTC 


9401 


ATGTATCAAT 


GGCTCAATCT 


TTTTAATTGT 


TAAGAAAAAA 


TGTATGCTGG 


9451 


GATAAATATC 


TTTCTAAATG 


AGTTTTTGTT 


CACAATGCTG 


AGTGTTTGTT 


9501 


TAGGATAGAG 


TCCTAGAAAT 


GGTATCACTA 


GGTCAAACAT 


TCAAATAATT 


9551 


TTAAAATATT 


TGATACATAT 


TGCCAAATAA 


TCTCAAATTT 


TTTACCAATA 


9601 


TACATTTATG 


ACAGTATGGG 


AT AAA TG TGT 


CTTTCTTATA 


CCAACTGACA 


9651 


ACATTAATGA 


TAATAC AT AA 


AATATTCTTT 


GCTAATTTGA 


TGGGACAGAA 


9701 


ATGTTATATC 


CTTATTAGCA 


TTTTATTATT 


GTGGTTGAAT 


GACTGTACTG 


9751 


TACAGCCAGA 


GATATTTGGT 


TCAAAATCCA 


TCTTCATTAT 


TTACTGTATG 


9801 


TGAAAA.TTTA 


GGTGAGCTAT 


TTAA.TCTCTT 


GATGCCTTAG 


TCTCCTAATC 


9851 


TA T AAA.G TG G 


GGATAATTGT ^ACCAATCATA 


TTAGGTTCCT 


GTGAGAATTA 


9901 


ACTGAATTAC 


T A T AG AAAAT 


GCTTAGAATG 


GTATCTAGTC 


ACCAGGAAGG 


9951 


ACTCTCTCTG 


TATTACTTGT 


TTATTATCTA 


ACACGTTTAA 


TTATTAATGA 


10001 


AGCTCAGTTT 


CGTTATATGC 


TTGGGATATT 


TGAAACTTTT 


CTTAGTGAAT 


10051 


TTTCCAATAA 


AATTATTTGT 


CTATTTTTCT 


ATGGACAAGT 


TGGTATTATT 


10101 


CTTACTGGTT 


TG TTTCAGGT 


TCAGTTAGTA 


AGAATTTTAA 


GGATTTTCTA 


10151 


TCACATTTTA 


GCAAACTTTT 


TCTGCATTTT 


ATCTTTTTTC 


TTTCAGA.TAA 


10201 


TGTTTGCAAA 


ATGTAAAAAA 


AACAAAAGGT 


TTCTTCATCA 


AGTTGGTATC 


10251 


TTTATC I j ,< p rrtr p 


TTATTGCTTT 


GTGATTTGAA 


AATTCTTGTC 


CTGAGAACCA. 


10301 


AAATATATAT 


TTGATGAAAT 


AGTTCTCTTC 


TTTTACTCAT 


TCTGAAGTCA 


10351 


TTGGAATTGA 


ATTTGGCATA 


TGATATAAAT 


CCTAATTTTA 


TATTTTATGA 


10401 


TATTCAAAAT 


T TC T AA C AAA 


T ATT7ACTTA 


ATAATCTAAT 


CCAGGTTTCT 


10451 


ATTGTTTCTT 


CTGTTTCCTT 


TATA_ATGCTT 


TTTCTGAAGT 


TATTTTTCCT 


10501 


AGACTTAAAT 


A.TTAGTATAA 


TATTATCATA 


GAGGAAAAAA 


TATCTGTTAG 


10551 


CTATGAATAA 


AAGGCTTTCA 


TCTTATTGTT 


GC ATT AA TAT 


ATTTAAA.TG T 



Fig. 2 (Forts. 5) 




10601 


AGAGAGCATA 


CAGATTAGCA 


10651 


TTGACATGAA 


CATGTATAAA 


10701 


GAACTTATTA 


GTGAATTTAG 


10751 


AAATTCCATT 


TTATTTATCT 


10801 


TTAAATATGC 


CATTTACAAT 


10851 


AGGAATTtAT 


AAAATGAAAT 


10901 


GAAATAAATG 


AAAGAAGACC 


10951 


TTGAGAGACA 


ATATTGTTAA 


11001 


ATTCAATATA 


ATGGTGAACA 


11051 


CAAGCTATTT 


CTATAATTCA 


11101 


CACCAGCATG 


GACTGTCTGG 


11151 


TCTGTCAGCC 


ACATCACGAC 


11201 


ACCTGGCCCA 


CTGCTGCAGC 


11251 


CACTGGTAAC 


TGCCAACAGA 


11301 


AGATAGGCAT 


GTAGTCAGCC 


11351 


GGCCCACCTG 


ACACTGCAGT 


11401 


AATAACCACA 


CCCTAACCTA 


11451 


TTTGTAGCCA 


AAGAAATCAT 


11501 


ATCAAAGCCA 


CAGTACCCTA 


11551 


AAAAAATTTT 


CCCATATGAA 


11601 


TTACAACAGA 


TATGCAGATA 


11651 


AAGAAAGAAT 


CTCAGAAGGT 


11701 


GACAAAATTA 


AAAGAGAATA 


11751- 


TTAAAGTGAC 


CAAATATACG 


11801 


AAAGAAAAGA 


TTAGAAAACC 


11851 


TAAGTCTAGC 


AAGAGTTTTA 


11901 


CCCAGGCCGA 


TAAAACG C AA 


11951 


GACTGTTTAA 


AGTCAAAGAT 


12001 


AGTGTATGAT 


AACCTATGAA 


12051 


TGGCAGAAAC 


TTTACAGGCC 


12101 


TTAAAGAAAA 


AAAAAACTAT 


12151 


TCCTTCATAA 


ATGAAGGAGA 


12201 


GAGGTAGTTT 


G TT AC T AC T A 


12251 


GTCTGGAAAC 


TGGTAGTGAA 


12301 


GAAAGTATAA 


AACTCCCTGG 


12351 


CCACCAGAGA 


AATCTAACTA 
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AAGAAAAAGT ATAATTGCCT TTTTTTATAG 
GAAAAACCAA AAAAATCAAT AAAACAACTA 
CAAGATCATA GCATACAAAG CCAAGATTCA 
ACTAACAAAA AATATTTGAA ATTTGAAAAT 
AACATCAAAA TATTGAACAA TAAAGTATTT 
CTCCTATACC AGGAATTACA GACCATTGCT 
AATATATGTG AAGAGATACT CATTTGTGGA 
AGTATCAGTA TTTCCCAAAT TAATCAATAG 
GAACACCAGA AGATGTTCTG TCGAAGC TG A 
AATGGAAATG CAAAAGGCAG TCACTGC C AA 
GTTCCAGTAG GTTACTTCAC TACTGCCTCT 
AGCTGCCCAG AAGCCAGAGA AACTCCTCAC 
TACCAGCATC CAGGCAAGCC ACCATCAGCC 
GGTACCACTG TACACTACCC TGGGGAACAA 
CACCTCTGCC ACCACTAGGG CCTGAAGCCT 
CCTCAGCACA GCTTCATCAC AGCTTCTGTT 
CCAAGGAAAT CACAAATGTC ACTGACACTG 
AGAGAGACTA CATTACTGCA CACACCCATA 
TCCAGACAAC ATCACAGGTA TATCTAAAGG 
AGCGAATTCA AATATAGGAA GAAGCGACTG 
AAGCTTCAAC AATATCCTAC ATTCAACCAG 
AAAGACAGGT CTTCTGAAAT AATCTAGTCA 
ATCAAATCCT TCCTGACATT TGGGATAACA 
AATTATAGAT ACCCCTGAGA GTGAAAAGAC 
CACTTAATTA AATAATATAT GAAAACTTCC 
GATATTTGGG ATGCAGGAGG CTCAATGGTC 
AAAGGTCTTA TACACAGCAC ATTACAATCA 
AAGGAATAAA TTCTAAAAAC AGCAAGAGAA 
GTAAACCTTA TCAGACTGAC AGCAAATTTC 
AGAAAGAATA GGACAATATA TTCAAAGTGC 
CAGCCTTAAA TACTATAGCC CACAAAATTA 
AA T AAAAGG T TTCCCAGACA CGAAAATGCT 
GACTGGACCT A C AA T AAA T G CTCAAGGGAG 
AGGACGACAT TTATCATCAT GAAAATACA.T 
TAAGCAACTA AAGGGAGGTA TCAAATGTTA 
ACCACAATGA CAAACAATAA GGGAAAAAGA 

Fig. 2 (Forts. 6) 
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12401 


AAGGAACAAA 


AATATATAAG 


ACAACAAATA 


AACAACAATA 


TAACAGGAAG 


12451 


CCTCACATAT 


CAGTAATCAC 


TTTGAATGTA 


AATGAATTAC 


ATTCTCCACC 


12501 


TAAACGTTAT 


GAAATGCCTG 


AATGATAAAA 


CTATATGATC 


CAAATATATG 


12551 


CTGATTACAA 


GAAACTTACC 


AGGCAGACAT 


ACATAGGCTG 


AAAGTAAAAG 


12601 


AATGG TAAAA 


GATATTCCTT 


GCAAATGGAA 


AGCAATAGTG 


AGCAGGAGTA 


12651 


GCTATACTT^ 


AATTAGATCA 


TACAGACTTT 


AAGTCAAAAA 


GAGTAAAATA 


12701 


AAAAAGACAA 


AGGATGTTAT 


TATATAATGA 


TGAGATTAAC 


CCAGCAATGG 


12751 


GAAATAACAA 


CTCTAAATGT 


ATATGCATTC 


AAC AC TAG AG 


AACTCAGATC 


12801 


CACAAAGCAA 


ATATTAGACC 


TAAAGAGAGA 


AATAGACTGC 


AAT AC AG T AA 


12851 


TAG TGG AG AA 


CTTC AAC ACT 


CCACTTTCAG 


TATTAGACAG 


ATAATCTAGG 


12901 


CAAAAAATCA 


ACCAGTAAAT 


TTTAGATTTA 


AACTAGATTT 


TAG ACC AAAT 


12951 


GGACCTAACA 


GACATTTACA 


AAACATTCCA 


TCCAACCACT 


GCAAAATGAA 


13001 


ATTTGTGTCA 


TCAGCACATG 


AAACAATGTC 


CAAGATAGAC 


CACCATATGT 


13051 


TAGGCCACAA 


ATCATGTCTC 


AGCAATTTTT 


TAAAAGTTGA 


AATCATATCA 


13101 


CATATCTTCT 


CAG AC CACTG 


TTGAATAATG 


CTAGAAATCA 


ATGCCAAGAA 


13151 


TAACGTTGGA 


AACTATACAA 


ATACATGCAG 


ATTAAACAAC 


ATGTTCCTGG 


13201 


TTGATCACTG 


GGACAATAAG 


GAAATTAAGC 


TGAAAATCAA 


AAAATTC TTG 


13251 


TAACAAATAA 


AGATTGAAAC 


ATAACATATC 


AAAACCAGTG 


GCATACAGCA 


13301 


AAAGCAGTGC 


TAAGAGGGAA 


GTTTATAGCA 


ATAAATGCTT 


ACACTGAAAA 


13351 


AGTAGAAATA 


TTTTAAAATT 


AGCAACCTAA 


CAATGTGCCT 


GAAGAAACTA 


13401 


AAAAATCAAG 


AACAAATCAA. ACCCAAAATC 


AGCAGAAGAA 


ACACAAAAAT 


13451 


AAAGATCAGA 


AAAGAACTAA 


ATCAAATAGA 


GACTAAAAAA 


ATACAAATGA 


13501 


TTAACAAAAC 


TAAAATTTGG 


TTATTCAACA 


AGATAAATAA 


AATTGATAAA 


13551 


CCGCTAGATA 


GACTAAACAA 


GGAAAAAGAA 


TATCCAAATA 


AACACAATCA 


13 601 


AAAACGATAA 


AGGAGACATT 


AC AAC AG ATG 


CCACAGAAAT 


AAAAAGGATC 


13651 


ATCAGAGACT 


ATTATTAACA 


ACTATATGCT 


GAAAAATGGA 


AAATATAGAG 


13701 


AAATAGATAA 


ATTCCTAGAA 


ACTTACAACC 


TACCAAGCTG 


TTGCATCAGG 


13751 


AAGAAATAGA 


AAACCTGAAC 


ATATCAGTAA 


TGATTAGCAA 


AATTGAATCA 


13801 


GTAATAAAAA 


ACATCTCCCA 


ACTCTTTTAA 


AGCTTTGGAC 


CAAATAGCAT 


13851 


CACAGCCTAA 


TTCTACCAAT 


CATGCAAAGA 


AG AAT A C CAG 


TCTTCTTGAT 


13901 


GCTATTACAA 


TAAATCAGAG 


GAAGGAATTC 




ATTCTACATG 


12951 


ACCAGTGTCA 


CCTTGAAACC 


AAAACCTGAC 


AAGGACACCA 


C AAAAAG AAA 


14001 


ACTACAGGCC 


AATAACCATG 


ATGAACACAG 


ATGCAAAAAT 


C A TT AAC AAA 


14051 


AT AC TGG C AA 


ACGGAATCCA 


ACAGCACATC 


AAAAAAATAA 


TATACCACAA 


14101 


TCCAGAGGGT 


TTGTATCAAG 


GATACAAGTA 


TGACTCAATG 


TAAATAAATC 



Fig. 2 (Forts. 7) 
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14151 AATAAACATG ATAAGCATCT TCACAGAATA TAAGACAAAT GAATATATGA 

142 01 TCATCTCAAT AGATGCAGAA AAAAATTTTT GATAAATTTC AACATCTCTT 
14251 CATGAAAAAA ATCTCTAAAA CTCAGCATAG AAGAAACATA CCTCAATATA 
14301 ATAAAGGCCA TATGTGACAA ACTCAGAGCT AATATCATAC AGAATGGGGC 

143 51 AAAGTTTAAA GACTTTCCTC TAAGAACTGG AACAAGACAA GGATGCAAAC 
14401 TCTCACCACT CCTATCCACA TAGTACTAGA AGTCCTAGCC AAAACAATCA 

144 51 GACAAGCAAA AGAAATAAAA AGTATCTAAA TTGAGAAGAG CAAGTAACAT 
14 501 TGTTCCTCTT TGCTGATGAT ATGGTTTTGT ATCTGGAAAA TACTAAAAAC 

145 51 TCCAGCAAAA ACCTCTTAGA TTTGATTAAT TAATTTAGTA AAGTTTCAGG 
14501 ATACAAAATA AAAATACAAA AGTCAGTAGC ATTTCTATGC CCCAATAATA 
14651 AAATAGCTAG GAAAGAAATC AAGAAAGTGA TCCCATTTAA ATTAGCTACA 
14701 AAAAATTAAA ATACCTGGGA ATAAATCAAG GAAGTTAAAG ATCTCTGCAC 
14751 AAAACTACAA AACACTGATG AAAGAAATTA AGGATTAAAC AAACAAATTG 

14 801 AGAAACATCC CATGTTTATG GATCAAAAGA ATTAATATCA TTAAAATGAC 
14851 CATACTTCCC AAAGCAATTT CCACATTCAA TGCAATTTCT AC C AAATTAC 
149 01 CAATGTCATA TTTCATAGAA TTAGAATAAT CCTAAAATTA GTATGGAATG 

149 51 AGAACAGAGC CCAAATAGCC AAAGCAATTC TGAACATAAA GAACAAATCT 

150 01 GGTCCTGACT TAATCACTAT GCAATCTATG CATGTAACAA AATTGAACAT 
15051 GGATTTTATC AATTTGTACA AATAAAAAAA TGTAAAAAAA GAACAAAGCT 
15101 GGAGGCTATA GTAGCCAAAA C AG C ATGGTA TTTTTAGACA AATGGAATGG 
15151 AATAGAAAGC TCAGAAATAA AGCCATATAT ATATATTGTG TGTGTGTGTG 
15201 TGTGTATACA CACATACATg" TATATATAAT GTGTACATAT AATGTTTTCT 
15251 ACATGTTCTA ATATTTATAT TCCATTCCAT TATACATATT CCATTTCTGT 

153 01 ATATAGGTTA TATAGAATTG GAAGACTATC TGCCATTAAA AAGAATGAAA 
15351 TCCTGTGATT TGCAGCAACA TGGT.TGAAAC TGGAGTTCAT TATCTTAAGT 

154 01 GAAATAATCT AGGCACAAAA AGATAAATAT CACATGTTCT CACTTATATG 
15451 TGGGAGCTAA TAACTTGATT ACATGAAGGT GGAGAATGGA AAGGTAGGTA 
15501 GGAAACAGAG ACTGGAAAGG ATGAATGGAG GGTAGGAGGG AAGGTGAAGA 
15551 GAAGAGAGTT AAAAGGTGTA AACATATAGT TAAAAGAAAT AAATTCAATG 

15 601 CTTGATAGCA GAGTACAGTG ACTACAGTTA ACAAAATGTA TTATACTCAG 
15 651 GTGATGAACA CCTAAATACT TGATCACTAT GCAATTATAT- ACGTGTAACA 
15701 AAATCACTAT GCACTATATA CGTGTAAAAT TAAATGCGTA C AAAT AAAAA 
15751 TAATAAAATA CTAATCCAGT ATCATTCACT GACAATGTTA ACTCAGGTGG 
15801 ATAGGCATTA AGTCAATACT ACTATAAGAA CCACTTCTTG TTTATGTTAA 
15851 TGCCATATAG AATGAAATAA AATTCACTAA AATCCAAAAA ATTAGAAAAA 
15901 CTATCAAAAC TCAATAATAT TAAGACAACC CAATAAAAAT GTGGTCAAAG 

Fig. 2 (Forts. 8) 
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15951 GATTTGAACA TACATGTCAC CAAAAAATAT ATTCAAATTT CCAATAAATA 
16001 CATGTAACAA TGTTCGACAT CGTTAGTCAT CAGAGAAATA CAAAATAAAA 
16051 TGGTAATGAG ATACTACTAG ATAGGCTTTT ACAGAGACTG ACAATACCAA 
16101 GTATTGACAA GGATATGGAG CAACTGAAAT TCTCATTCCT TGTGGTAAGA 
16151 ATGTACAATT ATATAACCAC ATTGAAAAAA CAAGTTTTCA GTTTCTTTAT 
16201 TCACCCAAA^ TATATGTCTT TTGGAAAAAA TTTTTTCCAG TCTGTGGGTT 
16251 GTGTTCTCAT TCTCTTGATA TATGTCTTTT CAAAGAGGCT GAGCTTTACT 
16301 TTAGACAGTG GTCATCAAAG TGTGTATATT TGTGTTTTTA TAATTTATAT 
16351 GCATATATTC CTGTGAAAAG ATACTGTATG CATTGTTCAA CATGTACAAA 
16401 TATAAGAAAG AT AT AG T AAA GAAATATATA TTTCTAAATT TATAAATGTA 

164 51 TTTATTGGTG TTCCACGTTG CAAACTAAAT AATCTACGTT GGCTAATTTA 

165 01 AGGAATTAAA CTATAGTAGA AGGTTCTCAT TTATTGGGAT GATTAGAACC 
165 51 AGCCTTTTTG CAGGCTATTA GCGAATCATA GCACTAGGGC TTCACTGCTA 
16 601 CCTCCACTGA CACCTCTGAC ACTTGAAACT TGAGGCCAGA TATC TGCCC A 
16 6 51 TGCTGATAGA AAACAACTGA ATAATTTAAT TTGCTAGATA ATAGAAAAGA 
16701 ATCAAATGAC TCTGCCACAT TGCTTGCCAG AAGATTGTTT TTCTCATTTG 
16751 TGACCTCTTG CCTATAAATG AT AG AT AG TC CCTGTGCTGC ATGCTATAGG 
16 801 TGTTCGTAAG AGAGTCTGGG AATGTGAGCT TTTTATATCC TATTTTTGGG 

16 851 TGGTAAAGGT CATTCTATTA GTCTGTTCTT AAACTGCTAA TGAAGACATA 
169 01 CCCCAAATTG GGTACTTTAT GAAftGAAAGA GGTTTAATTG ACTCACAGTT 
16951 CAACATGACT GGGGAGGCCT.. AAGGAAAGTT ATAATCATGG GGGAAGGGGA 

17 001 AGCACACATG TCCTTCACAT GGTAGCAGGA AGGATAATGA GTAAAAGGGG 
17051 GAAAAGCCCC TTATAAAACT ATCAAATCCC ATGAGAACTC ACTCTCACAA 
17101 GAACACAATT AG AG T AA C TG CCCCCATGAC TCAATTACTT CCCACCAGGT 
17151 CCCTCCCACA ACACATGGGG CTTATGGGAA CTACAATTCA AGATGAGATT 

172 01 TGGGTGGGGA CACAGCCACA CCATTTCATT CCACCTCTGA CCCCTCCCAA 
17251 ATCTCGTGTT CTCACAATTC AkATACAATC ATGCCCTTCC AACAGTCCCC 
17 3 01 CCAAAGTCTT AACACATTTC AG TATTAAC A CAAAAGTCCA AGTCCAAAGT 

173 51 CTAATCTGAG ACAAGGCAAG TCCCTTCTGC CTATGAGCCT GTAAATTCGA 
17 4 01 AAGCAAGTTA GCTACTTCCT AGATACAATA GGGTCACAGT CATTGGGTAA . 
17 4 51 ATACACACAT TCCAAACGGG AGGAATTGAC CAAAACCAAG GGGCTACAGG 
17 5 01 CCTCATGGAG GTCCAAAATC CAATAGGGCC ATTGTTAAAC CTTAAAGTTT 
17551 CAAAATTATC TCCTTTGACT TCATATCTCA CGTCTAGGTC ATGATTATGC 
17 601 AAGAGGTGGG CTCCCACAGC TTTGGGCAGC TCTGCCTCTG TGGCTTTGCA 
17 651 GGGTACAGCC CCACTCCAGG CTGCTTTTAC AAGCTAGTGT TGAGTGCCTG 
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17701 


CAGCTTTTCC 


AGGCACATGG 


GTGCAAGCTG 


TAGGTGGATC 


TACCATTCTG 


17751 


TGGTCTGGAG 


GATGGTGGCC 


TTCATCTCAC 


AGATCCACTA 


GGCAGTACCC 


17801 


C AG TGGGG AC 


TCTGTGTGGG 


GGCTCTGATC 


CCACATTTCC 


CTTCCACACT 


17851 


GCCCTAGCAG 


AGGTTCACCA 


TGAGGGCTCC 


ACCCCTGCAG 


C AAACTTC TG 


17901 


CCTGAACATC 


CAAGCATTTC 


CTTACATCCT 


CTGGAATCTA 


GGCGGAGGTT 


17951 


TCCAGACCTC 


AATTGTTGAC 


TTCTCTGCAA 


ATGTAGGCTC 


AACACCCCAT 


18001 


GGAAGCTGGC AAAGCTTGGG 


GCTTTCACCT 


TCTGAAGCCA 


TGGCCTTAGC 


18051 


TGTACCTTGG 


CCCTTATTAG 


TTAAAGCTGG 


AGCAGCTGGG 


TTGCAGGGCA 


18101 


CCAAGTCCCT 


ATGGTGCATA 


CAGCAGGGGG 


GCCCTGGACC 


CAGCCCACAA 


18151 


AAC C AATTTT 


CCCTCCTAGG 


CTTCTGGGCC 


TGCGATGAGT 


AGGGTTGCCA 


18201 


CAAAACTGTC 


TGACATGCCT 


TGGAGACATT 


TTCCCTATTG 


TCTTATTAAG 


18251 


ATTTGGCTCA 


TAGTTACTTA 


TGCAAATTTC 


TGCAGCAGGC 


TTGAATTTCT 


18301 


CCTCAGAAAA 


TGAGTTTTTC 


TTTTCTATGG 


CATCATCAGG 


TTGCAAATTT 


18351 


TTAAAACTTT 


TATGCTCTGC 


TTCCCTTTTA 


CAATTAAGTT 


CCAATTCCAA 


18401 


ACCATATCTT 


TCTGGATACA 


TAAAACTGAA 


TGCTTATAAC 


AGCACCCAAA 


18451 


TCATATCCTG 


AACACTTTGC 


TTCTCAGAAA 


TATCTTCTAC 


CAGATACCCT 


18501 


AAATTATCGC 


TCTCAAGTTC 


AAAG T AC C AC 


AGATCTCTAG 


GGCAGGGGCA 


18551 


AAATGCCACC 


AGTCTCTTTG 


CTAAAGCATA 


ACAAGAGTCA 


CCTTTGCTCC 


186-01 


AGTTCCCAAC 


AAGTTCCTCA 


TCTCCATCTG 


AGACCACCTT 


AGCCTGGATT 


18651 


TCATTGTCCA 


TATCATTATC 


AGCATGTTGG 


TCAAAGCCAT 


TCAACAAGTC 


18701 


TCTAGGAAGT 


TTCAAACTTT 


CCCACATCTT 


CCTATCTTTT 


TCTGAGGCCT 


18751 


CCAAACTGTT 


ccaacttctg" 


CCTGTTACCC 


AGTTGCAAAG 


TTACTGCCAC 


18801 


ATTTCTGGGT 


ATCTTTACAG 


CAGTGCCCCA 


CTCCTGGTAC 


CAATTTACCA 


18851 


TATCCATTTA 


TTCTCATGCT 


GATAATAAAG 


ACATACCCAA 


GGCTGGGTAG 


18901 


TTTATAAAGA 


AAAAAGAGGT 


TTAATTGACT 


CACAGTTCAG 


CATGGTTGGC 


18951 


AAGGCCTCAG 


GAAACAGAAT 


CATGGTGGAA 


GGGAAGCAAA 


CACATCCTCC 


19001 


TTCACATGGT 


GGCAGGGAGA 


AGAATGAGCA 


AAACGGGGGA 


AAAACCCTTA 


19051 


TAAAATCATC 


AGATCTCATG 


AGAACTCACT 


CTCTTGAGAA 


CAGCATGAGG 


19101 


GTAACCATGT 


CCATGATTCC 


ATTACCTCCC 


AACGGGTTCC 


TCCCATGACA 


19151 


CGTGAAGATT 


ATGGGAACTA 


CTACAATTCA 


AGAGGAGATT 


TGGGTGGGGA 


19201 


CACAGCCAAA 


CCATGTCAGT 


CATGATATGA 


GAAATTATCA 


AATTAAGATG 


19251 


TAGGGAAGGT 


TTTTAAAAGA 


TTTGAGCAAC 


C A C AAA TG AC 


AGATATGTGC 


1S301 


TAT AG TAG TG 


CAAAATACCA 


T^TTGCTCTT 


z._ t* pj±P>J-_z T A 


TAATTGTTCT 


19351 


TGATAATCTG 


AATTATAAAT 


GTCATGGATA 


ATTATGATGC 


ATTATGCTCT 


19401 


CAGCAGCTAA 


AACTTCAAGC 


AAAATACACA 


CCTAGAGAGC 


AATCAGCCTT 


19451 


AACAATAATT 


CTATAAATTT 


AATTTTCTTT 


ATTTCTGATA 


ATTACATTTT 
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19501 AGTTGACTTC ATATGTGATC TAAATACATT ACCATTATTT TGGACTTATG 
19551 ATGTAGCTCT TGAAGTACAT * ATATGATGTA GCTCTTAAAG TACATATAGA 
19 601 AGAGCAGATA AAGTATCAGT TCACCATTTC TTTGTAGTTT GTGCTTTCAT 
196 51 GATGAATATT CTCATCAATG TACAGATTAT TTGCAGGAGC CTTTTAAATC 
19701 CATGTGTpCA TTTTATGAGA CTTAGCTTTT GTCTGTATAT AATG TGTTTA 
19751 TTCAGTGTGC ATGGATTAAT TTGAGAGAGC ACAGGTATGG GTATCTTTAC 

198 01 AGCAGTGCCC CACTCCTGGC ACCAATTTAC TGTATTAGTT TATTCTCATG 
19 851 CTACTAATAA AGACTATATA TCACAATAAA CTGAGAACCA GCTGGTAAAT 

199 01 GAGAGAACTG TGGTCCACCT TTTCATTGTG GAGTTCTCAT TTTCCTTAGC 
19 951 TTATGCTGCT TATTCAACAC TATTTCTGCA TAATCTAATG CATTCACTAA 
2 0001 ATGAAGGTGC TGTGTTAGCC TCCACATGAT ATTAATACAG CCTATTTAAT 
2 0051 TTATCCTTCT TTAGATTAAA AATAAATAAG TAGTCATGTG CCACAGAATG 
2 0101 ACACTTCAGT CATTTGGTCA TTGAAGGACC ACATCTATTA CTGTGGTCCA 
2 015.1 ATAAGATTAT AATAACATAT TTTTCCTGTA CATTTTCATT GTTCTGATAT 
2 0201 GTTTTGATAC ATAAATGCTT ACCATCGTGT TAGAGTTGCC TGCAGTATTC 
2 0251 AGTACAGTAA CATGCTGTAC ACCTAGGAGC AACAGGCTAT ACCACATACC 
2 0301 TTAGGTGTAT AGTTAGGTTA TACCATCTAG GTTTGTATAA GTACACTCTA 
2 0351 TGATGTTCTC ACAATGAACA AAATCACCTA ATGATGCATT TCTCAAAACA 
2 0401 TGTCCCTGTC ATTAATACAG TATGTAACAA TACAGTTAGT ACAATATGTA 
2 0451 ATACATGACT ATATTCAGAA TTTTAGCTAT TTCTCTTATA TTTCAAATGG 
2 0501 ATTTTCTTAT GCACTGTGTG- GCACGGGCAT TTCATTTTAG TAACCACAGT 
2 0551 CTGGGAAAGG AGAAGTCTTT GAAGGATGTT GAGCAAGGTT ATGACATGGC 
2 0601 CAGATGTGAA TTTTTGATCA GTGACTCCAT GTTAGCAGAT AAAGTTGTAT 
20 651 TGGGAAAGAT CAAAAGCATG AAGGCCAGAT AAGAGGATAC TGTATGTTAT 
2 07 01 CATGGATGGA AATGTGAGGG ATGGCAGGAG AGATGCTATG ATTGAATGAA 

2 0751 TCTCAATATT CTTGGTGATC AAAGAATAAT GAGACTCATC CAATAAGACT 
20801 CTGTGAATGA TTG AATG TAG TTCCTAAGCT AGGAGGAAGA ATGAGGAATG 
2 0851 ATTTTCTGGT TCCTGACTAC AGCACAAGTT TTTGATTTTT AGAACAAAGA 
2 09 01 ATAAATTTGT ACATGCTTTA TGATTCCTGG TTGAATTTTT AAGGATAAAA 
2 09 51 AAGTCAGCTG TAATATTATT CTTTCCTGAT ACCATGCAGT ATTTGTATCA 
21001 GTGATCTTAT TCATTCCACA CACATTCTTC TTGAACCTGG ACACTGCTCT 
21051 AGACACTGAT TCTTTCCAAA TATCAGATAA GGTTATTCT7 ACGTAGACCC 
21101 TCAGTTCATA T AAA T A TG AT TTTCCCAAAA TGTGAAATAA GTGACTTTTC 
21151 ATAAGATATT TTTTAAAAGA ATGTCTTAAT AAT AAATTG T GAATGTTGCA 
212 01 TGG AAA TGT A GGTGACTTGC ATTGTGCATC CTGTGTTTGA TTCACTGCTC 
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21251 


TTGCATGTCT 


TGCCTTTAGC 


TGGGATGACA 


GCAGTTCAGT 


GAGCAGTGGT 


21301 


CTCAGTGACA 


CCCTTGATAA 


CATCAGCACT 


GATGACCTGA 


ACACCACATC 


21351 


CTCTGTCAGC 


TCTTACTCCA 


ACATCACCGT 


CCCCTCTAGG 


AAGAATACTC 


21401 


AGGTGAGAAT 


TACCACCTTT 


CTTTTTCCAG 


TGTTTCTGCC 


AGCTTTTTCC 


21451 


CCAAAATTAC 


TTAATATTAG 


ATTAAGGTAT 


AGCACAAGCC 


CTTAATCCAA 


21501 


AATTATTACA 


GAAACTGGAA 


AATGCAGAGA 


TAATAAGGAC 


TCCCTTTGCC 


21551 


actcctgaaC CCTGAAGCAT CTTTCATCTT AGTCTTTCCT AAAGCCACAA 


21601 


CCCTTAGGAG 


GAGCAACAAT 


GTGCACTGCA 


GCCAATTTTG 


AATAAACAGA 


21551 


AGCAGCTTAT 


ATATATATAT 


ATATATATAT 


ATATATATAT 


ATATATGATA 


21701 


TACATTACAT 


ATTTATATAT 


ATGTAATATA 


TGTGCCATAT 


AGCCTGGTGG 


21751 


TATAGTTATC 


TATACAAATA 


TATTTATTTA 


TTGTTAATAT 


ATAGAGTATA 


21801 


TAAATATCTA 


TTTATATAAT 


AGATATTTAT 


ATATATTAAA 


TATCTATTTA 


21851 


TATAATAGAT 


ATTTATATAT 


ATTAAATATA 


TAAAAATATA 


TAACATATAA 


21901 


TAGATATATA 


TTTTATATAT 


TATATAAATA 


TATATTTATA 


TATTTAATAT 


21951 


ATTAATGATG 


AATTACTATA 


TTTGTATAGA 


TAACTACACC 


ACCAAGCTAT 


22001 


ATGGTGTGTA 


TATATTAATA 


T AT AATG TAT 


AATTCTATAT 


TAATATAATA 


22051 


GTAACATATC 


AATACTTAAT 


ATAATATATA 


TTCAATTGAT 


TACAATCTAA 


22101 


TTCAGAAAGA 


TTTATGTTGC 


CATATCTCTC 


CTTACAATAT 


CGATATGTTT 


22151 


GTTTAAAAAT 


CCAGCAATTA 


TTTTCATAGT 


CTAATTTTAG 


ATAGTTCTTG 


22201 


ATTAATTTTA 


TATGATCTCT 


GAAATATATC 


ACTGGATCTG 


TTG TG AATG A 


22251 


TAAATCAAAA 


ATGAAAAATG 


GACATTACAT 


CATTAAGTTC 


TAGCTTGTCT 


22301 


TACTACTTCT 


TATGACATTT 


GATATAGAAA 


ATTTCTACCT 


TTCTGTAGCG 


22351 


TTTAATTGGT 


GTTTTCTGCA 


TGTATTTATT 


CTGAAATTCT 


CTAATATCTG 


2-2401 


CAAGTGGGAA 


TTATGTGGCT 


AAAATTAATA 


AAATGTAAGT 


GAAGGTAAAT 


22451 


CAAAATAGAA 


TCTTTGGATT 


TATCCAGTTA 


TCTGAAAGTA' 


CATTTCATTG 


22501 


CCTTAATTCA 


CACTTTATAA 


ATTTTTCTAC 


ATAAAGTTTT 


TCTGTAATAT 


22551 


TTGTCTTTAT 


AGCTGAGGAC 


AGATTCAGAG 


AAACG CTCC A 


CCACAGACGA 


22601 


G AC C TG G G AT 


AGTCCTGAGG 


AACTGAAAAA 


ACCAGAAGAA 


GATTTTGACA 


2 2 5 51 


GCCATGGGGA 


TGCTGGTGGC 


AAGTGGAAGA 


CTGTGTCCTC 


TGGACTTCCT 


22701 


GAAGACCCCG 


AGAAGGCAGG 


GCAGAAAGCT 


TCCCTGTCTG 


TTTCACAGAC 


22751 


AGGTTCCTGG 


AGAAGAGGCA 


TGTCTGCCCA 


AGGAGGGGCG 


CCATCTAGGC 


22SC-1 


AGAAAGCTGG 


AACAAGTGCA 


CTCAAAACAC 


CCGGTAGGCT 


TGTCGTTTGC 


2 2 8 51 


CAGCTGTTAT 


GCAAAAGTGC 


TTTACTTTAT 


TGTTTCCATT 


CAATCTTTGT 


22301 


TTTCTCTAAC 


AATAGCATTT 


CTAAAATACC 


AAATTCTTAT 


CCATATTAAA 


22951 


CATGGAGTCA 


AATAG TT AAA. 


TAGTTTTTCT 


GTCTACGTTT 


CACAAACTCG 


23001 


TCATAGAAGC 


CCAAGTAGGG 


CCTATATCTA 


GGCATTCTCT 


GGAAAGCCTC 
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23 051 CTCATAAACT AGGGGTACTG GATGCCTTAC CTTGCCAGAG TTATTTCAGG 

23101 TAATGGGGAA ATAAGATTAG GTTGCTAAAG CAACAGTTAA GTTTTTTTGT 

23151 TTTTGTTCTG. CGTTCTTAAT GAAAGTTTGG AATTTTTACA CTAAATATGC 

23 201 CACTGAATTG CACTACAGAC TCTGAGAGGA ACAAGCAATG AC AC TAATC A 

23 2 51 ATTGGAATGC TGGAGATTTG AAATATTGTC TGTGTATTAG ACTTCATGAA 

23 3 01 AGAAGAGAAT, GAAATAGTTC TTCAAAATTG TGCCATACTT TTTTTAAAAA 

233 51 GAGTCTCCCC GTATTTTTAA AATAATGCCT AATTATAAAT AGTGCCACCT 

23 401 GAAGCACTAA TTAACAGGGT ACTCCAAATA TAATCATCTC ACAGATATTC 

23 451 AAATGAATTC TTTTTCTAGT AATTAGCTTG ATAGGGTTAA GTG TTACCTT 

23 501 TTTAAAAAGA GTTGCAAAAT ATAAGACATT AACAAATAGC AAAACATATG 

23 551 TTTTCATTTT ATCTCTTCCA TCTCTCATAA TGTTTCTTCT GACAGCCAAA 

23 601 TTTTTGTAGC TATGCACTCA GTCCTCTCAA TATATGAGAT TTTTGATCTA 

23 651 AGCCAATACA TTTAGGAAGG GAAATAATAT AAAGAAGCAT TCACATTTTA 

23 7 01 CACATTGTTT CACGAAGTGT GGTGATATCA AACTCTACAG GC AC AT AT AT 

23 751 TTGTGTATTT CTCCTTAATT AGGGAAAACC GATGATGCCA AAGCTTCTGA 

23 801 GAAAGGAAAA GCTCCCCTAA AAGGATCATC TCTACAAAGA TCTCCTTCAG 

23 851 ATGCAGGAAA AAGCAGTGGA GATGAAGGGA AAAAGCCCCC CTCAGGCATT 

23 901 GGAAGATCGA CTGCCACCAG CTCCTTTGGC TTTAAGAAAC CAAGTGGAGT 

23 951 AGGGTCATCT GCCATGATCA CCAGCAGTGG AGC AAC CAT A ACAAGTGGCT 

24 001 C TG C AAC AC T GGGTAAAATT CCAAAATCTG CTGCCATTGG CGGGAAGTCA 
2 4 051 AATGCAGGGA GAAAAACCAG TTTGGACGGT TCACAGAATC AGGATGATGT 
2 4101 TGTGCTGCAT GTTAGCTCAA AGACTACCCT ACAATATCGC AGCTTGCCCC 
2 4151 GCCCTTCAAA ATCCAGCACC AGTGGCATTC CTGGCCGAGG AGGCCACAGA 
2 4201 TCCAGTACCA GCAGTATTGA TTCCAACGTC AGCAGCAAGT CTGCTGGGGC 
2 42 51 CACCACCTCG AAACTGAGAG AAC C AACTAA AATTGGGTCA GGGCGCTCGA 
243 01 GTCCTGTCAC CGTCAACCAA ACAGACAAGG AAAAGGAAAA AGTAGCAGTC 
2 4351 TCAGATTCAG AAAGTGTTTC TTTG TCAGGT TCCCCCAAAT CCAGCCCCAC 
2 44 01 CTCTGCCAGC GCCTGTGGTG CACAAGGTCT CAGGCAGCCA GGATCCAAGT 
24 4 51 ATC C AG AT AT TGCCTCACCC ACATTTCGAA GGTAAGGATG TATAAAATGA 
2 4501 TG C TG G/lAAA ATATAAAGGA TAAATATGTG TTAGACACAT ACATTACATA 
2 4551 TAAATGTGTG TATATATATA TTTTAAATAT GTATAAGGTA TATAATATAT 
2 4 601 ATATCTTAGA ATTCTTTAAA GTACACAGTG AGCTCTATGA AGCTTATCAT 
2 4 651 A T AAA C AG C T A G C AAAAAAA ATAGTTCTCA TTTTGAGAAA CAGTCAAACT 
2 4701 TCAAAGTTTC ACTGTCATTG TGATACTAGC AACACAAACA TCTAAG AG A C 
2 4 751 TTAAAAGCTG ATGGTAATAC CTAAGTGTAG TGATAAGGCA AAGTAATAGC 
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24801 


TTGTAAAATT 


TCTATAGATT 


TCCATTCCTC 


CTTTTCACAT 


TAAAAATTAA 


24851 


AACCAAATAG 


G TTTTC ATGA 


CTTTTGGCAT 


TCATTTCCAG 


TGTCATTTTC 


24901 


TTGCTGGCTC 


TTAATGAGTT 


GGTGATCATA 


AATGTAGATG 


AAGTTGTTTT 


24951 


CCTTGTAACA 


GATTCCATTG 


GACAGATTTA 


TACAGTGTCA 


TATCTTGACA 


25001 


CATTAAAGAC 


AATCAAGATA 


TGACATAATT 


TGAAACTATT 


CCAGTGTTTG 


25051 


G T AC AGTATC 


ACAACTGAAG 


AGTGGGCTAA 


GCTTTCTAAC 


TCTTCATCTG 


25101 


CTTTCTTTGA 


CATGACTCTG 


GTAAGGATCA 


TGACTTGGTT 


TCTGTTCCTG 


25151 


GATTGTTTTT 


GGTGTTAAAT 


ATGTGAAGTT 


CTGCTCTAAG 


ATATCACTGT 


25201 


TTTTAAATAC 


CCATGTGTTT 


TTAAGTGGTA 


GGAAAATAAA 


TGCAGTTAAA 


25251 


AATTGGG G AC 


AAATATCTAA 


ACCTCTCTGA 


GTCTGTTTTC 


TCATCTGCAA 


25301 


AATGGTAGAG 


TGTGGTTTAT 


AGTTCATTAT 


GGGTTCAATA 


TTTTTAATGT 


25351 


TTGTTTTTAT 


TCTGTTGACT 


AAACCCAGAA 


CTTTGATATC 


TTGGAAAGGA 


25401 


AAGATTTTGA 


AACATTTATT 


TTACAATAAA 


G C AATTTC AG 


ATACCTGATT 


25451 


GTTTGAAAAA 


CCTAAAGGCT 


TTATTCCTCC 


GTAGTAATAT 


TAATGCTGCA 


25501 


GAACTGTCTT 


TTTAAAATAC 


TGATTCTCAT 


TGGGAAGAAT 


GAATTATGGC 


25551 


G T AT AGGG AG 


AGTAAATATT 


TCTGTTTCTT 


AAGTAAAAGC 


CAATAGTGCC 


25601 


CTCCTGTGGC 


CCATTACCTA 


TGAAACAATT 


TCTCATATTC 


GTCATAAAAT 


25651 


ATTTCACTGT 


AGGAAATATG 


GATTTCATTG 


CAACTCAATT 


AGTAATCATT 


25701 


ATGCCATTAC 


TTCATATCAT 


TGTATTTCCA 


TATTTACATA 


AATTTGATTC 


25751 


TACCATCTGC 


TTCATTTACA 


AAACTAAAAT 


GTTTTCTGAA 


CTAAACTCCA 


25801 


AAATCTAACA 


GCACCAGCTC 


TGTTTCAAAT 


C ACT ATT AAA 


AAATGTATTT 


25851 


GAATAGCACT 


GGCAACTGAC 


ATAAAACCCT 


TTGGCCTCTG 


CTGGGGAAAA 


25901 


T AC AG A C AAA 


CTGACTTGTT 


GCCGACAATA 


TCAATATTGT 


TTCCAACCAA 


25951 


CTGCTCCCTG 


ACAGTGACTC 


AG AC C AC C AG 


ATACTCAACA 


CAACTCCCTA 


26001 


AACTTGCTTT 


AAGCGTTCCA 


TCTAGATTTT 


GAATAAACTG 


TTTAAAAATT 


26051 


TAAAAATAAA 


AAAAAAAGAG 


AAGAGCTCAT 


TTAAGTGTTG 


TCTATCGAAT 


26101 


GCGTAGAAGT 


TGTTTCATTA 


TAATGGTTCT 


GTAAATAGGT 


AACAGCAAGT 


26151 


ATGGTCAAAC 


TACTGACTTT 


GAGTGAAAGT 


CTCATGATCA 


CTTAAATTAT 


26201 


GAAAACCAGG 


GGTTTTCATG 


TTTGACTTAC 


TTTTC^^CCA 


CCCACTTCCC 


26251 


CTCTTTCCCT 


AGTAGCAGCT 


CAGTACTGAC 


CTACCCTTAT 


ATGAGAGATT 


26301 


TTCTGCACTT 


GATAAAGAAG 


TCCAAGCTTA 


TAAAAG TTC A 


TTAACATAGA 


26351 


GACAGGAAGT 


GCTTTGTAGT 


TCAGTACATC 


AAAGCACACT 


TGGCTCTGTG 


26401 


TACTGTAACC 


CGAAATATTA 


AATGTGGATA 


TTAGCTTCTT 


GGAACAACTG 


26451 


AAGTTGTTAT 


TTGTTTTTCT 


TTTAGGTTGT 


TTGGTGCCAA 


GGCAGGTGGC 


26501 


AAATCTGCCT 


CTGCACCTAA 


TACTGAGGGT 


GTGAAATCTT 


CCTCAGTAAT 


26551 


GCCCAGCCCT 


AGTACCACAT 


TAGCGCGGCA 


AGGCAGTCTG 


GAGTCACCGT 
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26601 CGTCCGGTAC GGGCAGCATG GGCAGTGCTG GTGGGCTAAG CGGCAGCAGC 

2 6 651 AGCCCTCTCT TCAATAAACC CTCAGACTTA ACTACAGATG TTATAAGCTT 

26701 AAGTCACTCG TTGGCCTCCA GCCCAGCATC GGTTCACTCT TTCACATCAG 

26751 GTGGTCTCGT GTGGGCTGCC AATATGAGCA GTTCCTCTGC AGGCAGCAAG 

26801 GATACTCCGA GCTACCAGTC CATGACTAGC CTCCACACGA GCTCTGAGTC 

2 6851 CATTGACCTQ CCCCTCAGCC ATCATGGCTC CTTGTCTGGA CTGACCACAG 

26901 GCACTCACGA GGTCCAGAGC CTGCTCATGA GAACGGGTAG TGTGAGATCT 

2 6951 ACTCTCTCAG AAAGGTGAGC TTTCCTGGAG GCATTGATAA CATCTTCCCC 

27 001 CTCTTCCCTG CACTATGCCT AACCCCCACC CCATTAAATT CCCTTGATTT 

27051 CACTGTGAGT GCCCCGGTGC AAAAAGATGT AAGACTGATG AAACCGGGCC 

27101 TTTCATTTGC TCTCATTACC AAATTTACAG AGGAATAGAA TCATTAAAGG 

2 7151 TAGGGTGAGT GGATAATTTT GTTAATATGA ATGCATACAT TTATAC C C AG 

272 01 TAGGCAATGT GAATAAAATT CAAGGAATGT ATTTAGATAT TGAATGAGGT 

272 51 CTCCTGAAGA CATTTTAATG ATTTGGCTTA AGCTTCAGAA CAACACTAGC 

273 01 TCCTTATGAT GACTTAAGCA TTTTGAAAGA CCAAATTGAA ATTATTCTA? 

273 51 AG TTATGCTC AGAGCAATAT GTTAAATTTG TTCCATTTGT ACTTCTATGA 

274 01 AAAAATAG C A GATGGATTGC TGGGAAATCC TAGTTGGCCT GGTTAAAAAA 
2 7451 AAAAAAAAAA TCAATTGTCA GCCATGAATC ATTAGAGAAA ATTATAGTG? 
2 7 501. CAGTGCCATT TTCAATAGAC TGCTTAAAAA GTAATCATAT TACAAAGTGT 
2 7 551 TTCTCATTGG CTTTATATAT ATATATAAAC TTAAAGTAGA GGACATAGCA 
2 7 601 AGGCATTTCT TACCTAATAT. GCTTACTGTG AAGCATCCCT TTTGAGCAAA 
2 7 651 ATCACTCTAA ATTTTCTCCT CAAAGTGATC CTCTCTTGAT TATACTGTAC 
277 01 TGACTCTTAC CACCAGGAAA ATGTCTTAAA ACCACTTCTT TTTCCTGATA 
2 7751 AATGCAATGC TATTTG TCTC TTGACATAAG TAAAGCTTTA AACATGGTCT 
2 7 801 TGGCCACATG TGGAAAGAAA TACTGGTCAC GTAAAATACC TGATATATCT 
2 7 851 TTCTATGTCT TCCCCTGTTT TTTTTATTTT TTTTTTATTT TTATTTTTTA 
27 9 01 ACTCTGATAT TG ATGATGGC ATTTATTTTC TAGACCTTCA GCCTTACTCC 
2 7 951 CGGAATGATA TTTTTAAACA TCAATTAAAG CCCTTAGCTA GACACTCTCT 
2 8001 GCATTACGCC AGTTTCCCCT TAATGTAGGA TGTCCCAATT TGAAATTCCC 
2 8051 CATTTTCTCT TGACTTTGTA AAATACAAAA CCCAGAGCAA AACATTGCTT 
2 8101 CTTTCCCTCT TTACTTCCTA CTTGCCTAAC AATGAGACAG GGACAGCCGT 
2 8151 GCAAATGGGG CTTTCCGATG ATAAAGTAAT TTTAACACTA ACTAAAATAT 
2 8201 TGGTGTTTCC TATGG TGGGC TGCTAATTAC AAAATACATT TTTCCTCCTA 
2 8251 AAGAAAAAAA CTGGGCCAAG GCAAACAGCT CAGTGATAGC AAATAAAATG 
2 83 01 TAACCATTTC CCTATGGTTT TGCTGTTATA TGCTATTATA GACAGCATAC 

Fig. 2 (Forts. 15) 



28351 


GTAAAGACCA 


GTAAGGGTTC 


28401 


TAAAATCTTT 


GATTCTAGTT 


28451 


ACATGTCATT 


TATAAAACTT 


28501 


ACAACCTATA 


GTTTTAATGA 


28551 


GGATTCTAAA 


TATCAACTTG 


28601 


TATCATTTAT 


TAACCACAAC 


28651 


TATTAAGATA 


ATCTGCAACA 


28701 


TCAGCATTTA 


GACATTAATC 


28751 


TTATAACCAA 


GTAACATTCA 


28801 


GCATAGCTAT 


AAC C AAAATG 


28851 


TTAACTGAAG 


TCAATAAAAT 


28901 


CAATTTCTTA 


TTCTTTTTAA 


28951 


TTGAAATAGG 


CCAATTTTAT 


29001 


GAAATGGAGC 


CTCACTCTGT 


29051 


CAGCTCATTG 


CGTCCTCTGC 


29101 


GCCACCTGAG 


TAGCTGGGGT 


29151 


TTTTGTATTT 


TTTGTAGAGA 


29201 


TCGAACTCCT 


GACTTCAAGC 


29251 


GGGATTACAG 


GTGTGAGCCG 


29301 


AAATGGGAGT 


ATTCCTACAT 


29351 


ATAAACTTTA 


AACTAATTTT 


29401 


TAAAATGCAT 


TAATGAATAT 


29451 


AGCTATAGTG 


TATAATATTA 


29501 


AGATTAAAAT 


AAATTTTAAT 


29551 


AATAGAACTG 


CAAGCAATAG 


29601 


AAGAAAG TTT 


ATGACCTATT 


29651 


TGGCTTCATT 


ATGG TTAATT 


29701 


GAAAACCAAA 


GAACTACACC 


29751 


GGCAAGTTAA 


TTAGCGATAT 


29801 


ACCTGTTTGT 


CTACAATTTT 


29851 


GGTAGCTTTT 


CCTATAGATT 


29901 


ATTAAATAAA 


ATAATAAAAT 


29951 


TGCTCTAGGT 


CATTGGTGGC 


30001 


TGGGTTTTGT 


TTCATGTGTC 


30051 


GTAACCAACT 


TTGCAAATTC 


30101 


ACGCTGCCTT 


GACATTTCTG 
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ATTTTTCCAC CTAAAATGTC GGGCTTCCTG' 
TCAGCACTTC TAAGGTAAAT GGGCATCTTC 
CTAATGAATG AATTATATTA AAATAGATAA 
ATGTATCCTA GATTGTATGC TCATATGTAA 
ATAACCAAAC CAAACATAGT GCAAATAGGT 
CACCTTCCAC AAAACTGGTC ATTTTTTAAT 
AGTTGGCCAT TTAGCCATCA GCCTATTTCT 
CCAGATTCAG AAATAAAGTC AAGTAACTAT 
AATC AAAAC T AGATGAAAGA TTGGTTAGTT 
CAGTTTTAAT ATTTTACTCT AATCTATATT 
TTTCACTATG GAAATACACT AGAAAATATG 
GCAGATTTAT TTATTGTACA TGTTCAGTCT 
TTATGTTATG TTATGTTATT TATTTGTTTT 
CGCTCAGGCT GGAGGGCAGT GGTGCCATCT 
TACCCGAGTT CAAGCAATTC TCATGCCTCA 
TATAGGAGCG GACCACCATG CTGGGCTAAT 
TGACGTTTCA CCATGTTGGC CAGGCTGGTC 
GATCTACCCT CCTTGGCCTC CCAAAGTGTG 
TGGCACCAGC C TG AAA TAGG CCAATTTTTA 
TAAAATGGCC AAAT AAA G AC TTTTTCTAAA 
GGATAAATAT GTTTTGCCTT TGAGCCTTAA 
TAAGCTGTAA AAAGTACATG TTAACTACAT 
ATATTAATTA GTGCCTTCCA GTAAATTACT 
ATAAGACACT GAGCTTTTTG TTTTCTTGAC 
CAAATTGCTC TAATCCTTTC ACGTACATTT 
GAAGAGAAAA GTAGATCTAG TGGGTGATAC 
AATTGATCAG TAG AATG TC A GAAATGCTAA 
AGAGAGAAAA TGTGTTAATG TAAATTTTAA 
ATAATAAAGA TGTATATAAG TTCATGATTT 
AGATGATTTT TTGATACTCA TATTTAAATC 
TTAATTTTTG TTTAAATTCC TCTTCGTTAA 
ACACTTTTTA 'ACAGTTTTCT CTTCTGCAGC 
CATTGAGCCA TAACTAGTCT ATATTTGTTT 
TGACTCAACT AAATTTTTAA ATAATTTGTA 
TGGGTTTGTC TTTAAATGTC AGATCTGGCA 
C C TAG AAAC T ATTGGCTCTA GGCAGTCAGT 

Fig. 2 (Forts. 16) 
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3 0151 GTCTGTCTGC TTCAGACTGT TGACTGAAAT CCCCATTCGT TTTCATGCCC 

3 0201 TATCTGGCCC TTGCTGGCAT ATGAGTTTGC AACCTTTGGT GATTTGCAGA 

3 0251 AATTGTCTAT GTTAGAAAAT CATTAATATC TAGATTCAAA CATATTTCTA 

3 0301 AATAAAGCTT TAAATTATTA TGGTAACTTT AAATGTATTT ATTCTAATTT 

30351 TTTTCATTAA ATTGCTCTTC ATCATATAAA TATATAATTT TTATACAACT 

3 0401 GGATGAGTTT GGCAGAAGAA TACCAACTTT TCATATTCTT TGTGGCATTA 

3 0451 AAGTTTAACT TGTACACATG GAAATAAATA ATCCTTAAAA TGACTTATGA 

3 0501 CCACATAAAT GCCTTAGCAC ATGTGGTTCA TATTTGGAGA TTTCTCATAT 

3 0551 TTGTTCAATA TAATTTATTT TGTTTGTTTA TCCACAGTAC TTAAGAAAAC 

3 0601 TTCTATAGTC AACATATATA CTGTAACTGG CCTCTACACA GTATAAGCAA 

3 0 651 TTAC CTTAC A TGGCTATTAC CGATAAAGTT AAAGTTGTAT AAAGCCTTTG 

3 0701 GATGCTTTTG ATTTCAGTGC TAAATAATGG AGTACACATA GAAGAAAACA 

3 0751 TTTTAGCTTT GGTTTGAGTG ATCAAATTTT AGGTCAGCCT TTTTACATTC 

3 0801 ATG TTATATC ATCCCCATTA TGCGTATCCT GTGTATTTAA TTTTGATCAT 

3 0851 TTGATGTCCT AAAGGAAGAA AGCTATAATT CTGCAATTTT AATTAATTTT 

3 0901 ACACTTTGCT TATCCACATG CCAGAGATTA TAAAAGAAAT CCCTAAACTT 

3 0951 GTCCCACTTA GTTGTTGATA TCCTCTTCCT GTATTTTTAG AGAGGCC ATT 

31001 TCTTATTTTC TCTAGACATA GCTTTTCATT CCTTCTTGTT ACCAATTGTG 

31051 AATTCCTTAA AATAGAGATG ATAAAATTTA TAGCCTTTTA AATACC T AAT 

31101 TTATGATTTC TAAAAGATGG TATAG CTTAA TTTCATTAAA ATATTCAAAT 

31151 AAATGATACT AGAATCAATT- AAGTTTTAAG CAAACATTCA TATATCTTTC 

312 01 TTCACATGTG TAAATGGGAA ATAAACATGC CTTTTTATTA AAAATAATTT 
31251 GAAGACAAAA GATAAGTATT AAACAACGTT TTATACCATC TCTGTCAATT 

313 01 GGAAGTTGTC ACTCTAACTT AGCCAGAGCA GATCTATCTC ATTTTGCATG 

313 51 TGATATCATA GCAAAAGTCT AATCAGTTGC ATAGGGAAGG AAAAACTAAG 

314 01 AT AG T ATTT A ATCAATAGGA TTCAGAGGAA AATTATGCTA ATGTGATTTA 

314 51 ATCTATTTTC TAGTAATCCT ATCACTAAAC TGTCATTGAA TTGTACTGCA 
31501 TTAGAAAGGA ACTCAAATAT GTGTGACGGC AATGGACATC TTGTCACCTT 

315 51 TAGTTGGCCT TTTTCAATGA GTTAAGCATT ATATGTGTGT TACCAAAAAA 
31601 TTATTTTTTA TAGTTCAGAG AACCATTTTT GTTGGATGTG TAATTTGGAA 
31651 GTTTTGTTTA CATTATGTCC TTAGGGGTTT TC TTTGT?TT AACAGCATGC 
317 01 AGCTTGACAG AAATACACTA CCCAAAAAGG GACTAAGGTA TATATTCCTC 
317 51 TCAGCACAAT TGCTACCTCT CTGTTGTTAT GTAAACTTTG TGTGCTGTCT 
31801 CTCTTCCTTC TTTGTTTGTT TG C AATG TAG CACATGACAT TG AGG ACG AA 
31851 ATCACTTTTA ATTTTGATGG TTTCTCTGGC CCGAACAGTT GGTGAGATAG 

Fig. 2 (Forts. 17) 
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31901 


CCCCTTAGGT 


AGAGATACTA 


31951 


TAAATTCCAA 


TGTGAATATC 


32001 


AAACAAACAA 


AACAAAAACA 


32051 


TTTTTTGGGG 


GCAGCAACTT 


32101 


TAAAATAAAA 


TTAACTCTTC 


32151 


CAAATATTCA AAACCCATGC 


32201 


AGGTTGAAGG 


ATGCTACAAT 


32251 


ACAGGACAAA 


TGCTGTAATT 


32301 


AAAATCTCAA 


AATTGTTTTA 


32351 


ATCAATTTAA 


ATCTGAATTA 


32401 


TTATTCCATC 


CATAATAAAA 


32451 


TTTTACTGTG 


TACTTTTATC 


32501 


AGGTATAACA 


CTGTATGTGT 


32551 


ATTTACTTAC 


AAAAAGAAAA 


32601 


TAATGGCGAA 


ACTAGGTCTT 


32651 


CAGCAATAGC 


AAATAGCTGG 


32701 


AAATTTATGT 


TCCAGTAAAG 


32751 


CTAGGCATGA 


TGTCAAGTGG 


3 2 801 


AAAAAAAAAA 


AAAAAGAAAA 


32851 


CTTCTGTGAC 


CATCCTTCAT 


32901 


CATTTGTAGT 


CCATGTTTTC 


32951 


TTTTGAGTTC 


TCAATTAACT 


33001 


ACTGCATATC 


TGATAGAAGC 


33051 




CTATGTGATT 


33101 


ACTGAGCAAT 


TATAATTAGA 


33151 


TAGTAACCTC 


CTCTGAATTG 


33201 


TAGATGTGCT 


TAAGTGTCAT 


33251 


ATCTCGGCAG 


GCCAACCAAG 


33301 


CTACTGGAGG 


GCTTCAGGAC 


33351 


TCTGCCATGT 


CATCTTCTGC 


33401 


TAAAATATTC 


TAAAATATTG 


33451 


T C A C AG AAA C 


CCTGGAATCT 


33501 


GGAGGGATAA 


AAGCACTTTA 


33551 


TCTTCACAGA 


AAAATCTCCA 


33601 


TGCTTAACAT 


AGATTAATAC 


33651 


G C TC AG AAAG 


TTCACTTGAC 
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GTAGAGATTG AGGCTGTCTC TCAAATTAAA 
ACTATTTTGA AGAAATAATA CTAAACAAAC 
AACAAACAAA AAACTTGTCC CAGGCATTAC 
TGGTAGAATG CAGAACTCAC TTCAACAAAT 
TAACTTTTGC CTATTAGAGT CATATGCATG 
AGTCTACAGA TGTGGGCAGT TAATG TTG AT 
CTGAATCAAA GAAAACATAT TTTCATCATC 
AAGGTGTGAT TTTTATAGAA TCCTTTTGAT 
ATTTCTATTT TGCAGGGGTA CTGCTATCAG 
ATCTAATATC ATTTAATAAT CTCAAAATAA 
AATAAAATAA AAATTTAACT TATGGCCATC 
TGAGGAAGAG ATAGAATGAT CTACTAATAG 
ATGAAAAGTT GGCTAATTTT GGTGCTAAGA 
AGAATATACT TAGTTTGGTG AAACACTGAA 
TCTCCATTAT TTTTTTTCTC TCCAATTTTT 
CAATTATTCC ATGTTAATAT TTTGATCCAG 
CGAGCACATC TCCCTCCTTA TTTTTGTAAT 
CAGTTTAACA AAAGAAC TGT TTTTCCTTTA 
GCTGCCAATA TGTATTC CAT TTCCCTATGC 
TTCCCTTGGC CCTGGCCCAC CACTGTCCTC 
ACCCTCTTTA CATCCTTTCT TGCCCTGTGC 
TGGCTGTCTG CTCATTGCTT ATGATTTCCA 
ATAATTTTCT CCTCAAAACC CTTTATCTTA 
CAAACAGATG GCGTAAGATC ATCTGGAAGA 
TTCAATCTGT TTGAAATTGT TCATTCTGAA 
TTTTCCTGTC CTGGCATTGC CTTGCCCTTG 
AGCTGTGCTG TTTTGCAGAT ATACCCCATC 
AAGAGGGCAA AGAGTGG TTG CGTTCTCATT 
ACTGGCAACC AGTCACCTCT GGTTTCCCCT 
AG C TG G AAAA TACCACTTTT CTAACTTGGG 
ATTTTGTTTT GTTTCTTTCA CCACCCACTC 
CTCCATAACA CAACACGTTT TC ATTT AAAG 
ACAGTACCTT TCATTTGTGT CATTGTTTAC 
AACATTATGC TATTTATTGC TCATGACAAA 
TGTGGTTGTT TTCTAGTCTA GGCTCCAGAG 
TTGAAAAAGT CTTACCATTA CTAAGGGTTC 

Fig. 2 (Forts. 18) 
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337 01 AAGGCAGTAA CCAGTTCAGA ACATCTGACT TTAATCCCAG GGGCCTTTCC 
337 51 ATTCCATTTA AGAATCCTCT TAAAAAACAG GAAGGCATCT CCTTATTTAT 
33 8 01 TTGTCTGAAA TATTAAAACA TCCTTAAAAC AAAATTAGTA ATCTTTTGTA 
33 851 GAAAATAGAA ACAATTAGGA AGAAAAAAAT ATGTAATTCC ATGACTCAAA 
33901 GTTAACTTCT TTTAACACTG TTAAAGTTAA AACTCCTTAA AATTCATACA 
3 3951 AGAATTTCT<? TTAAGACAAT ACTCTGAACA TTTTCAAATA GATACAATGA 
34001 AAAATAAATT ACCAACTTAG TCATTGGGTT ACTTTGTATT TAACATCATT 
3 4051 TGTATGAAAT ATAAAATCAT TTGCATAAAA TTTCATTAAA AGCACTCTGA 
34101 G TAAC AAAAT AATTAAAGAA AACTAAACAT GCCAGATACC ATTTXATAGA 
34151 TTCAATGACT TTAAAAATAT ATTT.ATTTTC TATAAAGTCA CATATAAAGT 
3 4201 ATTTTCATTA TTTTTATGGT AAATATTTTT ATTATTAGTT TATCAGAAAA 
3 4251 ACTTGTACAT AAAGATGAGT ATTGATACAT AATCTTATTA GAGCCAGAGA 
34301 CGATCATTCC TTCTAGAAAA ACACATCTCT GAATTTAGGA CGGAGGACAA 
34351 TGAAACAAGA AATTTCACTT TATAATTTAC CTTTG TC AAA CTATCCCAGA 
3 4401 GCACATCAAT TCCATCATGA AAGTACTCTT TTGACATTAT ATAAAAAATT 
3 4451 AGTAATAGAA AACACACAAT CCAAAACCTT AT ATTTTC T A AACTTCAAGT 
34501 TAATC ATCAA CTTCTCTTAG ATTTTTGAAG ACCTG AAAAT AAACATAATT 
3 4551 TCAAATAACA GAACTCAAAC ACCATATACA TTTGTAATGA GGCACAACAG 
34601 TCAATTTTGA GCCTTGTATT TTCC AGGTTT TAGCTGAATA ATCTTCACTG 
'34651 CTTTCTTAGC TTTTTGCCAG TC T AG TTTGG GGACTATTTT GCCTTACTGG 
347 01 GCCTAAACAG AGTGTAATAT, TAAAATATGT TAATAAGCCA TACTGAGAAT 
34751 AAGATAAATG CAGGTTTCTA ACTCCTTAGG GACACAAGTG GGGACAACAC 
3 4801 ATTCCATGAA CACAGGTGAA TGAATGCCCC TAGTTTCTCT GAGTTGGACA 
3 48 51 ATTTCATGCG ATCATTTTTT TCTCTGAGGC CAAAGTCTCT GGTTTGATCT 
3 4 901 TCCTAGCAGC TTCCAGAACA GAAAGTGAGT TTACTTTGTC TCCATATTCT 
34951 TTTTCTCCAT GCTCGGGAAT CCCCTGCTTT CCTGATCCCA CCACAAAAAC 
3 5001 TCCCCTGAGG ATGAAGCCTT GGCTTTCCAG GCTTCCAGGG AAGCCTCGAT . 
3 5051 TCCTGGCTGG AGGTAGTTGT ACCACACTCC CAGAGGGCTA AATCCCATAA 
3 5101 ACATCATCTT CTGTCTTTGT AGATCATAGA ACTTTTTATT ATCATCCAGG 
3 5151 AAGATTTCTC TTTTGAAACA AGGCTGGAAA AACTTTATGT CAGTCCTGAC 
3 5201 CTGCTCTTTA ATGACTGCGT AGAGGGAGAT GCCCAGCTTA TCCAACTTGG 
3 5251 G TTG C AG AG A GGACAGATCT GCAGCCCCTC TTG C C A G AG A AAACATCCTG 
3 53 01 GCACAGCCAC AATCACAACT CCATTCTTCT CCCGATAGCT CCTTTGCTTT 
3 53 51 GAAACTCATT GGTTACTTCT CCAGTGTTTT CAGGTCTATA TTCTCCAGGT 
3 54 01 ACTCCAGCAC CTCTTTCCAG GGCTTGGACA AAAAT AC A TC TGTGTTGGCC 

Fig. 2 (Forts. 19) 
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35451 


AGCATCAGTG 


CCAAGGCAGC 


AGCCTCCAAG 


GGCTCCTGCA 


CCCATGGACC 


35501 


ACATCCACAC 


AGAGAAGCAC 


CTTGGGTCCT 


CAAGTGCCTC 


CCTCTTCTTC 


35551 


CCTTCTCCCA 


AACCTGAAGC 


CCAGACACTA 


AGGGGTCAAA 


CCCTCCTGGG 


35601 


CCCTGAGGGT 


TCCAAGGGCC 


TCATTACTTT 




CACTGGAAAA 


35651 


AAAATTCTAA 


TCATGCACCT 


ACAGAAGATT 


GACATTTTTC 


AGTAAGTTGG 


35701 


ACTTTCCAGC 


TTTCAGCCAG 


GACAAGACTC 


AAGGCTATGT 


CTTTTCTATT 


35751 


GCAACCCTTf 


CCACTATATT 


GAGTAGGGCT 


TTTAGCAATT 


GAAAACAATT 


35801 


ATTTTGGTCA 


TGGTTTCATA 


TAAGCTAATG 


ATTTCATATC 


AAACACCAAG 


35851 


TTTTTG TTTC 


CTAACCTATA 


TAGTGATAAG 


AGAATTTACC 


TATAATGCCA 


35901 


AAGAATGTAT 


AGCTTTTATT 


TGCTTTAAGA 


TGCAGTTGAT 


TTTTTAAAAA 


35951 


AGCGAAAAGC 


CTAACACTTT 


AACTTCAAAA 


AATGAATTTA 


AAATGTTTGT 


36001 


GTAGG TC AT A 


GGAATATGAA 


AAAATTTTAT 


ACAACATCTA 


AAACACACCC 


36051 


AAATCACCTA 


AAGTGCTATA 


AGCTTGCTAA 


GTACTTCATG 


TCTCCTATCA 


36101 


ATTCTTTCAT 


TAATTGACGT 


TAATTTGATT 


AGTTGACTCC 


TTCTTCTATT 


36151 


TTTCCTCACC 


ATTATTATTC 


TGATTAAATC 


CACCTTCATT 


ATTCCTTAGG 


36201 


AACAAAAAGA 


CTCACCACTT 


AACTATGTCT 


GACATTGGTG 


AAGTCGTTTA 


36251 


AACTTAATTT 


TCTTATCTCT 


TGAATGGATA 


CATAATACCT 


AGGTTATATT 


'36301 


GTAAAGAATG 


ACG G ATATAG 


TGTATGTAAA 


GATGGAGAAG 


TGTGTAAGAC 


36351 


TTGACAGATT 


CTGCCAAATC 


ATTATTTTCA 


CTGGAAAGCA 


TGTCTTACAC 


36401 


'GATCATAGAG 


TAGCATTCAT 


CAGATATGCC 


TGAGCTTTGT 


CTACATTTAA 


36451 


TTGAG TAGTA 


ATTCGCAACA 


CAGTAACCAC 


AGGATTTTAT 


GTAAAAGACA 


36501 


TTCACAGATT 


GTGTTTTTGA 


AAGATTGTAT 


TTTTGAAGTA 


CAAAACTATG 


36551 


ACATTGTTAT 


CAAGGACTCA 


TTTACCACAA 


ATATCAAATA 


TTTGTGCAAA 


36601 


.GATAAGTTTA 


TGCTAAGATT 


TGCATAAATT 


AAAGTTAACA 


TGGCAACTGA 


36651 


AGCTAACATG 


TC C A TGGTC A 


CAATGTGTTA 


AAAAATGAAT 


GGTTCTGTAG 


36701 


CACACTTGGG 


AATG TATTTT 


ATT AC ATAG T 


TTTCAGAGTT 


AAAACACAAT 


36751 


TAATAAATGA 


AATGTGAATT 


ATACTTTTAC 


TGACAACAAA 


GCTCTCTGTA 


36801 


GAGCTTTAAT 


GTTCTAATGA 


ATTAGAAAAC 


CACTGATCAA 


ATACATCCCT 


36851 


TACATTTCAT 


TGCTATAGAA 


ACCAAGTCTG 


AAAGGTTAAG 


TTTACCTTTC 


36901 


TAGGATGTGG 


GTTTCCCCCC 


TTAATCTATT 


GTGGTTTATA 


TCAGAGATCT 


36951 


CTCAGCTGTG 


TCAGACAGGC 


CATGACTTAA 


GTGACACTGC 


CCTCTTGATT 


37001 


CTCTTCATAC 


TTTTCCAACT 


ACAATTCTTT 


CTCCTGGGGT 


TGCTCATCTT 


37051 


AACATAGCTG 


TATCATTTAT 


TG TAG AC AC A 


AGGTCACTTT 


TGAGAGTGAA 


37101 


TGGGACTATA 


TTAATAATTG 


TTCCAGGTAT 


TAGGTGCAAA 


CCCTGGGCAA 


37151 


TGCAATTCAT 


CCTCCATCTC 


CTCCTTATAT 


TTATGTGTTT 


ACCAAGTTGT 


37201 


TTTTCCTGTA 


GACTTTTTTT 


TATCCTAAAC 


CCTTTTTCTA 


TGTTCTCATT 
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3 7251 CACAACTTTA ATTCTAATCT CTCAAATCAA CATTTCACTT TCTGTCTGAG 

373 01 ACCTTTTTCA GCTCTAAAAC TAAAATCCCA TCAGTGTGCT AGACCATATA 

3 7351 GCCACCTGAA ATCAAAGTCT TTTCTTAAGT TCTTTTCTTC TATTTG TCTT 

3 7401 ATAATTTCAT GTATCATCCT TCTGTCTACT CTAGCACAAA ATCTGTGTAA 

37451 TCAATAGTCT TACTTGAAAC TGTGCTCTTC ATATTGTACA TTTTCAATAG 

3 75 01 ACAGGAACCT GTGATTTTAT CTTCAGAATA TCTCCTACAT CTGTCTCTCA 

3 7 551 TTTTCAGGGA CATTGTCCTT . GCTGAAGCTT TTTTAACTAT AGACAATTGC 

3 7 601 AGCAGATTTT AAACTGATCT TACTCTGTCG ACTCCCTTAT GTTTCAACAT 

3 7651 TTTCACCCAT TGGAAGGTAT AAAAGAAGAT ATTCCTG TCC GTGTCAACAT 

3 77 01 AATCTCATGT ACCTCTCCAG ATCTTAGAAA CACGTATGGC TTCAAATCAG 

3 7751 GCATTTGGAG ATCTTTATGC TGTATGGTTT CAGAGTGGAA AAAATGATTG 

37 801 ATTCAAAAAC ATAATATTTA AAGAGTTTTT ATTG TATTT A CAGTTCACCT 

37 851 GAACCTCTGT TCATTGGGCA AGAAAATGAG TAC TCTT AAA ATGCAATAAT 

37901 AAATTAAAGT TACTTTATTA TTAAATTTTA AATATATATA TAT A.TAC TTA 

3 79 51 CCTTAAATAT GTCCTCTTGT TGTCTTTTAG CATCACCCAT TTTTGATTTG 

3 8001 ACCATTATCT TTTCTGAATA ATC AG TAAG A TACAGGATTA TTATTAATGT 

3 8051 TCAAAAGTTG CAGTATTCAT GTTTTCTTTA TTCTTTCTAC CAATTAAAAT 

3 8101 GTGTTAATAT ATAAAATTTT TAGAAATTTT AC TAT AAAAA ATCACAACAT 

3 8151 ATATTAGAAA ATTAAGATCA CTACAATATG TCATATTTAG TAGACTACTG 

3 8201 TGAGCTACTG CCACAGTAAA CTATGGTTCG TGTGTCGTTC CCAGCATGCT 

3 8251 AGCCCTAGTA GAAACCATTC CCATTCAAGA AAGACTAACA AAGTATAGCT 

3 83 01 TACATAAATC AAAAAGTCTT TGGATGAAAC TTCATTTGGG AAAATAACCC 

3 8351 AATCGCTACC CTTCAATTTT TTATGAATGA AAAAATGGAA GAATAAAGGC 

3 8401 CTC TAAG ATC CATTCAAAGC CAGGAGACAC ACAAGAATTT CTAAATAGAA 

3 8451 GAGAAACAGA AGAGGTCATA GTTCTTGTGA GCCATCTCAT AACCTGGTGA 

3 8501 GACTCATTGT CATGCCTCCA TGCATGATAA CAATCGCTCA GATTCATTTT 

3 85 51 TCATCTTGCC AC AAGGG TTA CATGCAGGAA CATTAATGTC AACCTGTCAC 

3 8601 TTCTAATATC CATCTAATAT TCTCTAAATT CGATGGATCC TTTTGCATAT 

3 8651 GGTGATTGTT AAACACCTTT GCATAGGAAC AGTTTCTATG CTTTTGTACT 

3 8701 CAAATCTTCC TCTACCTTGA ATCCTTTCCC ATCTTCGTGT TCAACCTTCA 

3 8751 ATCTTCTCAG AA TG AA C TC C TGTCTTCTAT TCTTTCGGAA GCATAGAAtC 

3 8 801 TCACGGTCAG AAGAGACCAC ATCTGGTTCA ACCCTTCATC TCTTATGTAA 

3 8851 AATTTTATGA CATCTCTAGC TTCTTCTTTA AACCCACCAA TGACAGAAAC 

3 8 901 TACTAAAATC TAGAAATAAC AC CTTTGAAA TTCTTTCTTT AAGAGATCAA 

3 8 951 ATAAAATTTT CCTGAATCTT CACCTATTGT TCC TAG TTAT ATATATCCAG 

Fig. 2 (Forts. 21) 
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39001 


ATTCTACAAA 


ATAAGTCAAA 


GTTAGATTGC 


ATATGACAGC 


TCTTCATATT 


39051 


TAAAACAATA 


TAATAAACTC 


ACTAGTTAAT 


GTCTAGCTGT 


AGATGCAAAA 


39101 


GTAGAGAGTG 


ACTTGGGGTT 


ATTTAAAAAC 


CCAGTCCAGC 


CAGACACATT 


39151 


GGATCATGCC 


TGTAATACCA 


GCAGCACTCA 


GGAGGCTGGG 


GCAAGAGGAT 


39201 


CCCTTGTCCA 


GGAGTTACAG 


GCTACAGTGA 


GCTATGATCG 


TGGCACTGCA 


39251 


TACTCCAGCC 


TGGAAGACAG 


AGTGAGACCC 


TGTCTCACAA 


TAATAGTATT 


39301 


TAATAATATQ' ATAAAAACCC AGTCCACATT TATATAGGAT 


CCTGTTTTCC 


39351 


TCAAGTTACT 


ACAAATAAAT 


ATATAATCTT 


AATAAAAGGT 


TAGTGGCTTT 


39401 


GCCAAGATAG 


TGGCTTGGCT 


ATGCAAATGC 


AATTTAAGAC 


AAAGTTGGTA 


39451 


GCCCTCTTTT 


TCCTAATACA 


TTGCCATATC 


TGTTTCTCTT 


CTATTTGGAA 


39501 


ATTCTTGTGT 


GTCTCTTGGC 


TTCGAATGGA 


TCTTATAGTC 


CTTTTATTCT 


39551 


TCCATTTTTT 


AG TC ATAAAA 


AAACTGAAGG 


GTAGTGATTG 


GGTTATTTGC 


39601 


CCAAAGCAGA 


TGGAAAGCAA 


AACTACCACT 


AGAAGCTCTT 


TACCAATTTG 


39651 


TGTTCCATTC 


AAAAAATTAT 


CTTTGTATGT 


CTTACATTTG 


TCTTCTACTG 


39701 


TATAGTTTTT 


CTTGTTCTAT 


TTTACATATT 


AACTTTTCTC 


CTTCTTCAGA 


39751 


CATCTGCCCT 


ACTGGCTACT 


CTTGAAATCA 


GAGACTGTGT 


CATATTTTTC 


39801 


CTTCTATTCA 


AC T AC AAC AT 


C T AAAAG C AG 


ATCTGTCATA 


GTTATTAACT 


39851 


TAATTGAACA 


C TC TTAAAT A 


GTTAGGTGTA 


ATTTC C AATG 


CAGAAGCTAT 


39901 


CAAAAGGGTT 


TGTAAATGCA 


AACTATTCCC 


TTTAAAATC T 


ATCCTAATCC 


39951 
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iLAi lAAltal 


TTCATCTTGA 


TAG AG CTAAG 


T ATTATG TAT 


TGAAATTGTA 


40001 




1 L.AL 1 1 (j(jA I 


AlLiLl tjt- AA 


TCATTTAGGT 


AAGAATTATA 


40051 




AAkjL- AAA I AA 


AAlAiLt I 


lAALtL lAlA 


GATACGTATA 


40101 


C T AAAATG AT 


GCACTTGCAA 


ATTTG TTTAA 


TACTTCATTA 


ATTTAAACAA 


_ 

40151 


GAGTAAATTC 


ATACTGTGAA 


CCAAGAATAG 


GGTGACTTAC 


CCCAATCTTG 


40201 


CCACCTTAAA 


CATAAACATT 


TTAAGTCTTC 


AATGTCCTAC 


AGTGTACCTA 


40251 


CTGGCTGTTG 


TCACTAATCA 


GACCGAAATG 


GTACTAATGG 


TCACTGCAGG 


40301 


CTGAAGGAAT 


A TG C TTG AAA 


GATAGGCAGA 


TCCTCTCCCT 


CTCCCTTTTT 


40351 


TACTTTTTTC 


GCCTTTCCAT 


CCTTTCTTCT 


TTTTTTC C AA 


TAGATTGTGC 


40401 


ACTTTGGAGA 


TTCATATTTT 


CTTCCTTTTC 


CATTACATTT 


TAAATATGTG 


40451 


ATTCTTAGTC 


CTATGCTTCC 


TTTTACTCCA 


ATCAATAACT 


GGCTCTATCA 


40501 


GAGGGTTGTT 


CTGTGTGTTA 


ATTCGGTTAA 


TACCAGGATT 


ATCAAGCACA 


40551 


GTGCCTTCCA 


AATGTGAGAT 


ACTTCTCTCC 


GGTTACCTCT 


GGGTTTACTT 


40601 


m 1* C C T G ^ T T T 


ACATTGTTTT 


GAGAGCCAGT 


ACTTGTATTA 


AGAAGAAGTT 


40651 


TAGTGCCTGT 


GTCACAGAAA 


AAATCTTAGT 


AAATTTTGAA 


GTGATGTCAG 


40701 


AACAACTCTA 


AGCCACTGAC 


GGATTCCACA 


GGGTTTTGAA 


AATACTCGTT 


40751 


AGTTCCCTTT 


ATATCTTAAG 


AGGCTCCTGC 


CTGCTTTCTC 


ATATACCAGT 
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40801 


AACAAACTTG 


CTTTTCTTAA 


. ATATGAGCAT 


TTAGAATATC 


TTTCTCAATT 


40851 


TTTC TG TTTT 


GCTTTTATTC 


CAAATTTCAC 


AACTATATTG 


TTTTCCAATG 


40901 


TAGTTGTACA 


TACAATCAAC 


CAAATCTTTC 


CTTAAATTGA 


TGACTACCAG 


40951 


GTGAGGACTC 


TTTGGCAATA 


AGCAATAAGA 


AAATAAATTG 


TTATTAAAAA 


41001 


TTACAGACTT 


AAGATACTTC 


TTTGGAAATA 


TAACATGTTT 


GTGACTTTTG 


41051 


ACCATCTCAJT 


CATGATATGC 


TCATCTTAAA 


CAGAGTAGAA 


AATCATTTCA 


41101 


TATAATTAAC 


TTTATGGTGG 


GCTGCAGATA 


CCATGTATGT 


T AC ATTG TG T 


41151 


TTAGTTATAA 


AAATGTTTAT 


TATACACTAT 


TTCCTTATAA 


TCTAACTTTG 


41201 


' ATAATAATGA 


TGGTCCTAA.T 


CATGAACTTA 


CATCAATTAA 


GAGCTTGAAG 


41251 


TGACTGAGAG 


TATTTGCCTG 


GAAGCATTTA 


AAGCCCTTCT 


TGGGAAA.TTT 


41301 


AGATGTTTTA 


TATTTTACTT 


TCTTTTTGAT 


TTTGCTTTTT 


CCATTAAAGT 


41351 


GATTACTATT 


TTTAAAGAGA 


AAACCGAAAA 


CTC TAG AAAG 


ACCATCTTTT 


41401 


CTTCATAACA 


GGTAGCAGAA 


AACACCATGT 


TATTACATTT 


CTAGCAAGAG 


41451 


CAGTAGAGGT 


GACTTGTTGG 


TTTTGTGTAC 


TG TTGCTTTA 


GAAATTGATG 


41501 


TAAGGCTTCC 


CATAAACGTG 


CCAGAGGAAA 


AGAGGGACGC 


AATGGGATCT 


41551 


GTTATTGAAC 


ATTTCAGAGG 


CAGACTCTTA 


CCTTAAATAG 


GGACTCACTA 


41601 


TACATTCATG 


TTTTCATAAG 


TATTGGGATC 


ATGTTCTTAC 


TTTCTA.TCAA 


41651 


CCTGCTATTT 


TCATCTTTCA 


AGCTTAAGAG 


TAATAGGCTC 


TGTGTGTTTT 


41701 


GTTTTTCAGT 


GAGCCCAACA 


AATTTGTCTC 


AATTTAACCT 


TCCCGGGCCC 


41751 


AGCATGATGC 


GCTCAAACAG 


CATCCCAGCC 


CAAGACTCTT 


CCTTCGATCT 


41801 


CTATGATGAC 


TCCCAGCTTT 


GTGGGAGTGC 


CACTTCTCTG 


G AGG AAAG A C 


41851 


CTCGTGCCAT 


CAGTCATTCG 


GGCTCATTCA 


GAGACAGCAT 


GGAAGAAGGT 


41901 


AAGCGTTGAG 


GGGGATTAAA 


GATGAAGTCA 


CTTTATTTAA 


ACCCTGAGAG 


41951 


GGAAACCATC 


GTGTCACTCA 


CATC A C AAAG 


ATTCCTGAAG 


AGGAA * ATA A 


42001 


ACT AG TG T AA 


TTATCATTTG 


GGAAACTAGA 


AGCTTGAAGA 


AGTTT^A ttp 


42051 


TGTATTATCT 


TCTATTTCTT 


TATGTAT'l'TG 


GAAATATGCC 


AGAATTTGTT 


42101 


TATATTAATA 


CTTGGCTGTA 


GAAGAGTTTA 


GACTAAATCT 


ACTTTTCCAA 


42151 


TACAGAAATA 


TACATATAAA 


CTATTTTCCC 


AGGTGCATCA 


AATATCAGAG 


42201 


CAAATGTTTT 


GTTTGACATT 


TTGGTTAAAG 


AGCCATAAAG 


AC A C AC AAA C 


42251 


C AG AAA CAT T 


ATTTTATGAA 


AATACCACAT 


GTTGCTGACT 


TTTA rrir ~' CT ^* •* 


42301 


GGAATTCCCT 


CTGGTGCTAA 


TTTTTTA ""^T^ 


TATCATTTTA 


G AA T TC A T A T 


42351 


TGTACCTACT 




A T AAG TC A C T 


ATTTCTTCAT 


CCAAT3GCAA 


42401 


TAAAATTGTC 


ACCTAACCTA 


ATAAATATCT 


TTATAGTTAT 


AT AG TT C T A T 


42451 


GTAAATACTC 


CAAATAAATC 


AGCTTGAAAA 


CCTCAGGAAG 


CTGAGTTGAT 


42501 


GCTCAAATAT 


ATATATTTTT 


GTAAACTGTA 


GAAGCTCAAA 


TG TC AAA T T T 
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42551 


AACAATAATT 


TGAGAGACTT 


TTCTCTTTGA 


TTTAATGAAT 


TTTTTTAGTA 


42601 


TCCATAAAGA 


AAACTTACAG 


CATACATATT 


ATAAAGCATG 


TCAGCTAAGG 


42651 


ATAAAATAAA 


ACTAGACATA 


CAAATTCAAA 


CTGATTAGAA 


TG AAATTATT 


42701 


AACCCTAATA 


ATTATGTTTA 


AAAGAAAAGT 


CTCCAAATCT 


TGAGACATAC 


42751 


C AG AG TTTAA 


GTCTTCAGCC 


ATCCATTTAC 


TTGTGGTATA 


AACTTAGGCA 


42801 


AGTTTCTtAA 


CCTTCTTATC 


CCTAAGTTCT 


GCATCTGTAA 


CTTCTTAGGT 


42851 


TTGTCACAAG 


GATGAAATAT 


GAGAACAAAG 


AATAATTCTG 


TTCCATGATC 


42901 


TTTTCCCTTC 


CTACCTTCTT 


ATTTAAAGTA 


TCTTCTGACT 


GAGGGGTTAG 


42951 


GCAGCAATGA 


AAATTGACTC 


ATGTTTTTCA 


GGTCACCACT 


ATGGATTCAA 


43001 


TATACTGGCA 


TTAAATCAGT 


AGAGAATAGT 


TGTCATTGCC 


TTTTGCAATA 


43051 


TTAACCAAAC 


CACTCAGTTC 


ACTGTGACAG 


ACAGTGAATT 


ATATCCAATG 


43101 


ACTCCACTGA 


TTTTTTCCAT 


G T AG ATAG AC 


. AAAATATAAC 


TACTCTCAAA 


43151 


TGTAAGGACC 


CTGCTTTCTG 


AAATGGTTCT 


GTTGCTCTCT 


TCACAGATAG 


43201 


GCTTCTTATA 


ATACTTTTAA 


AATAATTTGC 


TAAGCATACA 


GATGGCTTTC 


43251 


.TAGAGTGTGG 


CATTGACAAA 


TAAAGTGATT 


TTTATATACT 


GGGAAATTCT 


43301 


GGCCTTCAAT 


GTATCAGGAT 


TAAATAATCT 


GAATTTCTGA 


AAGCTAGCCT 


43351 


AAGTGGGCAA 


GATGGCTTTT 


TTGTGCTCAC 


GCATTGAATA 


CTGAACTATT 


43401 


CTAG TTCTTA 


AATGGCGATC 


TAGATTCAAG 


ACTTATTGAA 


CTAGATTGAA 


43451 


GGGACTTTAT 


TGATATCCTA 


CCTAATGCTC 


ACACTGACAG 


ATGAAGAGAC 


43501 


TGAGCCACAT 


GTTCTAAGGT 


CATAAACAGA 


AAGAATGAGA 


ATGAGATGGT 


43551 


CTAATTAATT 


GTCCACCTTT 


CCTATGGTAC 


ATCAGGGTAA 


CACTTTAGTT 


43601 


TACGAGGGTA 


TT ATT AG AG A 


TAGAAAGAAT 


TTTTT r r"T , TAA 


ATAATTGACT 


43651 


CAAATACCAA 


CATTTTGCAC 


ATTACATAGA 


GTAATAGCTT 


TGCCCAAGTT 


43701 


AGAAAACTGG 


GGGTTCTTCT 


TTATTCCTCT 


TTTGACCACA 


TCTATATACT 


43751 


C AG TTTT AAA 


AAGGTTCTTC 


CTGGTATCCT 


TCAATTCCAT 


CCCCATGTTT 


43801 


TCATCTACAA 


GCCTAGTGCA 


GCTATTCCAG 


CCGTCTCCTG 


ATCAGGTCTT 


43851 


AAGCACCTCC 


CATATGTCCT 


TGTAGTACCC 


ACCATATTGA 


TCTCAGTAGC 


43901 


AATCACAGTA 


CTCTATTGTA 


AATATCTTTT 


AAATTATTAT 


CTTCTCTTTG 


43951 


AGCTTTTGGG 


ATTTTATCTT 


ATTTATTTTT 


GTAGTTCCAG 


GATCTAGCAA 


44001 


CAGCTTGTCA 


CATCGTTCAT 


ACTCAACTAA 


TG TTTG TTT A 


ATGCACAATG 


44051 


AGCAGAAATA 


AACATACTAC 


TCCATAGTAA 


AAAGAGGATG 


AACTTTTCTG 


44101 


CAAATATTAA 


TCAGCACCAT 


TTTATCCACC 


TTTTGGGTTT 


AGTACATTGG 


44151 


AAGTATAGGA 


GTATAAAGCA 


GAATGTCCAA 


TGTTTACAGT 


GATATTTTGA 


44201 


AAT A G A T AAA 


AGCCAGTGCG 


ACATTTCCAT 


TCTCAATTTC 


TCTGAGACAT 


44251 


CACCTTGAAA 


AAAAAAAGTA 


TTTTTCTCTT 


CCTAAAATTA 


GTAAAGGAAC 


44301 


AGTAATTCCA 


CATTTATAAG 


AGTATGATGA 


ACGCATCACA 


GATAATGTTG 
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44351 TAATAACACA TTAGATAAAA GTGCTTATTT TCCTGAAATT ATATGGAGAA 

44401 AAAAATCTGA AAGTGGACCT TTGTTGGATA CAAATGAAAT AAATAAGGTA 

44451 CATACATTTT TTAAGGTTCG AAAGTTTATG GCAACTTTAG TTTGGG TTTC 

44 501 CATGCTATTC TATTTATTAT ATGGGAATTT ACTGTAGCTT TCAACATGTA 

445 51 CGAAACAGGC TGGTAGGGCT CATGCTTGTA GGCTTCTGTC TAATAACTTG 

44 601 GCAACTGAGQ TACTTTAGGG AGTATGGATG GGGCTCTTCC ATGTCTCAAC 

44 651 GTGCTGACTG CCAAAAAATT ATAGCAGGCT GGTTCTCAGA ATCTTATAGT 

44701 TAGTTGTTAT TACTTAATTT CCCTAACCAC CCGTTCTTTA CTTTTTCTGT 

447 51 AAAGGCTGGA ATTTTTGAGT AGACCTTATT GTTTTAACTC TATTG TTCTG 

44 801 TTTGTTTTCT CCAGTTCATG GCTCTTCATT ATCACTGGTG TCCAGCACTT 

44 851 CTTCTCTTTA CTCTACAGTA AGTAATGGCT GTTAAGAAAA AGCTTGTGCT 

449 01 TTTGCCATGC ACACAGATGA TGAAATAGAT CATTTTACTG TGAACAGATC 

44 951 ACATTCATCT ATGACTTGCA CAGGAGTTGT GTAGCAAAAT AACGGCATAC 

4 5 001 TCTAAGCTGC CCAATACCCA ATAAAGTGCC AGGTGCTCCA CCTGCCATTC 

4 5051 TTTGGTCACT TACATGTGCT TTCACTTGGC TTTTGTGCAC TCATCATAAT 

4 5101 CAATGAGTGG ATGTAGAATT CGATTTCATA AAACCTACTG AGGTATGACT 

45151 TGGAGTCTCT GAAACCATGT ATGTAGTCTG CTATACTATC ATTTTAGTAA 

4 5201 TGACGAGTTG TCCATGTTTT GTTCTTTGAG CCGTGACTGT TAATTGTTCT 

4 5251 ATAGTATTTT CTTCTCATTT TTTATTTTTA AGTTTATTGT TGAGAGGATT 

4 5301 ATCGAAGGGT AAAAGCAGTA AG GGT AAAGG GTAAAAGCAT AAAAGAACCA 

4 5351 GAGATGTTTT TTTTTAAATA, TACCTTTTGA AAGAGTGTGA TTTTTTTAAC 

454 01 TTTTATTTTT ATTTTATTTT ATTTATTTAT TTATTTATTT TTGAGTCGAG 

45451 GTCTTGCTTT GTCACCCAGG CTGGAGTACA ATGACACAAT CATAGCTCAC 

4 5 501 TGCAACCTTG AACTCCTGGG CTCAAGTTAT CCTTCTGCCT CAGCCTGTCA 

4 5551 AGCAGCTAGG ACTACAGGCA CGCACCACCA TGCCCAGCTA ATTTTTAAAT 

4 5601 TGTTTTAGAG ACAAGGTCAT TGCTATATTG ACCAGACTGA TCAATACCCA 

4 5651 TGGCTTCAAG CAATTCCTCC TGCTTTAGCC TCCCCAAGTG CTGGGATTAC 

4 5701 AGGTGTAAGC CAGCACACTT AGATAGAAAC TTTATTTATT AAGAGAAAAA 

4 5751 TACCAGTGTT TCAAC-TTCTT TTGCAAACGT GTGACATTAT AATTCATTTT 

4 5801 TGACAAGGAG AGTTTTTCTG TTTGG TAAAT ACAATTCTAT CTTTTTTAAA 

4 5851 AAAGTAGCCT ACAGGAAGTT ATATTTTATG AGTGAGTCTT TTTAGAGCTA 

4 5901 GGTTAACAGT GAGGTATATT TAAAAGCAGC CTACTGAATC TCAATGGGAC 

4 5951 TTGAGTACTA TGAATAAGCC TTAATCCTGT ACTGTAAGGT TCATGAAGAG 

4 6001 TTCATAGCCT . CTGCTGTCAC TGATCAACTG AGCATCATGG GCAGTATTTT 

4 6051 TTTC AC TC AT TATCATTAGG TTCAAATGTT TGTTTGAACC TTCTCTTTAT 
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46101 


AGATTAATCT 


CATATATTTA 


CTGCCTTACA 


TAGTCATTCA 


AAATCTGACT 


46151 


GTTATTGGCA 


GAAGTAATAT 


TTTTCTAATC 


TCTCCTTTCA 


ATGATTAAAA 


46201 


TTACCCATAG 


CTTCTAGAAA 


TTAAGAAATC 


ACGATTAGTT 


TTTAGG TAAA 


46251 


TGTACTTTTT 


GTGCAAATGG 


ATAAAGTGAG 


GAATGTGTAA 


ACACACATGA 


46301 


AAAAAACACA 


TAAAAGAAAT 


ATATTAAGAC 


TTAGTGTTCC 


TCCTGTTGGG 


46351 


CCAGCACTTGC 


CATTTGTTGG 


GGAATTGTAT 


TCTGATTTAA 


ACCATTGCCA 


46401 


TTTACATCTA TGTGTAACAT 


CAAAAGATGT 


AGCATCATTA 


TTATTCTAAA 


46451 


TACATACAAT 


AATTAATATT 


TGGATAAAGC 


TACCTTCATG 


AAAC CTAAG A 


46501 


AAAACTAAAT 


TAAAAAGAAA 


GAAAGAAAGA 


AAAATACACT 


TAGATAGAAG 


46551 


AAATAAGGTC 


TAG TG ATTGG 


TAGCACAATA 


GAGTGACTAT 


AGTTAACAAT 


46601 


AATTTATTGT 


ACATTTCAAA 


ATAGCTAGAA 


AAGAAGATTT 


GGAATGTTCC 


46651 


TAACAGGAAG 


AAATGATATT 


CTTCCTAAAT 


GAAGAATGGG 


ATATTCCACT 


46701 


TTCCCAGATT 


TGATCGTTAC 


ACAGCATATG 


TTTGTATAAT 


ACCACATGCA 


46751 


CCCCATAAAT 


ACATACAACT 


ATTGTGTATC 


CCAATATTAA 


AGATTTTTTT 


46801 


GAAAAATTTA 


TTCCTCAAGA 


AAAGGATCAT 


GAGTTTAAGA 


AAAAACAGAT 


46851 


TACTAGTCTA 


CCAGTGTCCA 


GTAGACCTTT 


CTGTGTTAAT 


AAAAGTGTTC 


46901 


TGTATCTACA 


CTATCTAATA 


TAGTAACTAT 


GAACCATATG 


TTGCCATTGA 


46951 


TTATTTGAAG 


TATATCTGGC 


AAAGAGATGA 


ATTGACTTTT 


TTATTTTAAT 


47001 


TAATTTACAT 


TGAAATAGCC 


ACATGTGCCT 


AGCAGCTACT 


AGATTGGATA 


47051 


GTGCAAGTTT 


ATAGAGAACA 


CAAGGGGTAC 


ATTTGTAGAT 


AGGAGTGGGA 


47101 


TGTCAAAATG 


ATGAGGATAA 


TTAGAAAGCA 


TACATGAGAA 


ATATTGTTTT 


47151 


AAGAGTAGAA 


TATGAAATGG 


GAACACAGAT 


TAAAATAGAG 


TATGTATATA 


47201 


TATACATATA 


TATGTGTATA 


TATATACATA. 


TGTATGTGTA 


TATATATACA 


47251 


TATATATGTG 


TGTGTGTATA 


TATATATATT 


TATAGGCCAA 


T ATATGG AG G 


47301 


TAGGGTATAT 


CCTAGTGTTA 


AGTGAGTAAA 


GAATGGATTA 


GGTGATCGAG 


47351 


CCACATGAGA 


AGGTGATATT 


ATTAGAAAAT 


TGAAAGTTGT 


ATTTGAGATG 


47401 


ATGAAAATGA 


TATATTTGAA 


TTGAAAAGTA 


AACTGTAGTA 


AAATAATTCA 


47451 


AATAAATGAA 


TATTTGGGGA 


ACTACTTAAG 


AG AAAAA T C A 


TAAAACATGA 


47501 


GGAGTCATTC 


TTTCCCCAGT 


CCGCCATGAT 


CAGGCCTTAG 


GATTTAATTG 


47551 


GCAATGAGAA 


AATACCTATG 


AAAATGCTTT 


TTAAACTATC 


ACATGAAAAA 


47601 


GCAATTTATT 


ATTTTTCATG 


CCTTCTTAAT 


AACTCTCAAT 


AGAGATTTAG 


47651 


TTGATTTGCA 


TTTTTGCCTG 


GTTCAATCAA 


GAAATTATCG 


CGTGACATCA 


47701 


GGCAAGTTGC 


CAAATTTCTT' 


TGGACTATAC 


CTATAAAATA 


AAATTTGAAA 


47751 


ATATTAGCTA 


GATCTAACCC 


ATTTGTCTCC 


GGATGTCTGC 


AAAGTGGTTG 


47801 


GAAATCACAA 


GCCTAACCTG 


ATCTGCAGAG 


GTGTTACCTT 


TGGCAAACTT 


47851 


ATGGTTTTTG 


TGTTTGTTTT 


GAAATCTAAG 


GCCAAGCGCG 


GTGGCTCATG 
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47 9 01 CCGGTAATCT CAACACTTTG GGAGGCTGAG GCGGGTGGAT CACTTGAGGT 
47 951 CAGGAGTTCG AGACCAGCCT GGCCAACATG GCAAAACCCC GTCTCTACTA 
48001 AAAATACAGA. AATTAGCCCG GTGTAGTGGC ATACGTCTGT AATCCCAGCT 
4 8051 ATTTGGGAGG CTGAGGCAGG AGAATCGCCT GAACCTGGGA GGCTGAGGCT 
48101 GCTGCAGTGA GCGCCACTGC ACTCCAGCCT GGGCGACAAA GCCAAACACT 
4 8151 GTCTCAGAAA AAAAAAAAAA AAAAGGAAAA GAGGGAGAGG GGAGGGAGAG 
4 8201 GGAGAGGGAA TCTAAGCCAA CACTGTGAAA TATTGTGAAA TATGGAGCTT 
48251 CTACCTAAAA ATTCAAAATT TTAAATTCCT TTTAAAAATA ATTGGAATAT 
483 01 CTATGGAATA TCTAGCAATA CTAAGATGAA ATTCCTCTGG GTTTTCAGTC 
48351 ACCTGTAATT GACACCTTTA GATGTTGGCA TGGGCTCTCA GGAAGCCACA 
48401 GCCTCCACCA ATGCTTTTCT TCCTGACACT GAAGCTAAAT TTGGGTGGCT 
48451 AGTTTTCATT GTGCTGTTGC TTTCCTCATG GGAAAGAAAT ACCCTTTGCT 
48 501 ATTTATATTG CTGTCAAATG GGAAAATGAA AGACAGCCAA GGAAGATCAT 
48 551 GTGACTATTT AAATACTTCA AGTCCATTTA TTC TTTATT A GCCTTGTCCT 
48 601 GTTAGGCATT TAAATTTTTG ATCCCTGCAA TAGATGTTTT TTG ATTAAC T 
48 651 G T ATATT AAA AACTATATTT AACCTGTTTT GAATTTGAAT TCTAAATTGT 
4 8701 ATTTTTTCAT GAGAGCAAGT GTCATTTTTG ATTCATTGTG GATTGTTTAA 
4 8751 CATGTTGCCT AACAAATAGC TAATACTAAC GTCATAACTT TTTAATTAGT 
4 8801 AAATTTGAAT GGATAAATGG CCACTTATTG GCTTATAGAA TAAATAAAAA 
4 8851 CATTTTTATT CAGTCAAGTG TTTCATATTT TTTATCATCT CCAGGACATT 
4 89 01 GGGCTTGCTC AAAACCATTG ..TTAAAAAAAA AATGGCAAAT AATCCAGTTC 
4 89 51 CATCATGATA TCATTAATCC CACACCTAAG CTACTGAAAA AAATATATTA 
4 9 001 ATA TTC TG G C TCATTGCTTT ATTTTTATGG TAACACCCAC CTGGTATTAA 
4 9 051 TAACCACAGA G T AC GAAAG A AGGCAAAGGT TAAAGCAAAT AAT AG TTTTG 
4 9101 AAAAATTGGT AGTGAAAAAA GTCATGCTAT ACGGTATGTA TATAATAGAT 
4 9151 ATTTAATGAT TATGCTTGCT ACTAGTATAT GTAACAGGAC TATTATAGAT 
4 92 01 TAACAAAAAT GCGGTGAGTA TATTTCTTGA TTATTTTTTA AAAGAATAAA 
4 9251 TTATTATTTA AAAATACATG AATTATTTAT TGATTCTTGA ATCTTTACCA 
4 93 01 GCTTTCTATA ATTCTAGGAA GCCTAGAAGC AGAATTGGGC AGGATAAACT 
4 93 51 GGCAAAAAAT GTAAAAAGTA GGCCGGGCAC GGTGGGCTAC AGTGAGTCGT 
4 94 01 GAATGCGCAG TGCACCTGAG TGATAGATCA AGATCCTGTC TCAAAAAAAA 
4 94 51 AAAAAAAAAA AAAAG AAAG A. AAGAAAGAAA AACAACAACA AAAAC AAAAG 
49 5 01 CAAAGTACTA GGGAAAACTA ATAGACATAG TTACATAGTT AA TTG TG CCA. 
4 9551 TATGTTTTAA GGCAATGAAA CTTTTATCTT AATATTCCTT GCTTACTTTT 
496 01 TATTCAAAAA CCAAACTGTG TATAAAACCT TAAAATTATT AGG ATC T AAA 
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49651 


AAATAAAATC 


TTTCCTTAAA 


AATC TAAAAT 


TGAGATGTAA 


ATTATTCAAG 


49701 


AGTGCTTTTT 


AAAACAGTTT 


TCTTATAAAG 


GCTATTAGGA 


TTCTACCACT 


49751 


TAGCCACTTT 


ATTATTTAGC 


CACTATATTA 


CTAAGTTTAC 


ATATTTTTAA 


49801 


AGGTAGTGAA 


AATATAGGGA 


AGACAAAGCT 


CAGGTTAAAA 


GAGTTTCTGG 


49851 


CAAATAAAAT 


ATATCCTGAT 


GGTTAGACTA 


CTTTGCTTTA 


TG TTTTC TG A 


49901 


AAGAAAAGCA 


GTAAAAAACA 


GTTCAGGTAG 


TTTTGTGTCA 


ATTAATCTAG 


49951 


AACTATACCA AAAGTAGACA 


TAGAAAACGA 


GAGATTGTTT 


TTCAGCTTTG 


50001 


GATCTGCTTA 


TGGCAATAAG 


CAGACTTGTA 


CTATTCAACA 


ACATTATGCA 


50051 


TTCTTCAACT 


TTTCCCAGAA 


TAAGGGAGCT 


TCCCAAATGC 


AATGGTGCAC 


50101 


ATAACTCATT 


TTCTGGCATT 


TTGCAGCCCA 


GCATGAAGAA 


GAAAAACAGA 


50151 


GCTAGGAGTT 


TTCTGGAAGT 


CAAGTCAAAA 


ACACCCTGCA 


AATTCCTATG 


50201 


GCAGTCCTCC 


TTTCCATAAG 


CTGCATAGCC 


AAAAATGTTT 


GCCAGACACT 


50251 


TTTATCACTG 


GGTGTTTCAG 


TGTTTTCATT 


GTTTAAGCGT 


TTTGC TG AC T 


50301 


TGTGATAATT. 


AAAATTATTA 


ATAATCATTA 


AAGAAAGAAA 


AAGTAGAAGT 


50351 


AAATAATGTT 


AATTATCTGT 


GGTTATCAGT 


AGAGGTCTGT 


ATGTTACCCC 


50401 


AGCTTTATTT 


GACATTGTTT 


GTGATCAGTA 


AATCACAGAA 


TAAAATTCTG 


50451 


ACATCTAAAC 


CTTGGCTAGA 


GGTCTCTATA 


ATTTTATGGA 


GTCTGTTTCC 


50501 


T AC AATC TGT 


ATGAAAGATA 


CTTCAATATT 


TTAAGTTTAC 


ATGCACCCAT 


50S51 


C TTTTTTAG A 


GTATAATTTT 


ATAACTATTT 


GGTTTATGTT 


GCTTATGATT 


50601 


TACATCTTAG 


AGTCTTTTAA 


TTC TG TC TTT 


TGCTTAAAGG 


AATATTATGG 


50651 


TV fTlO 7v T\ TV fT>/"*» Ti 

ATCAAATGAC 


C T ATATTTT A 


AGAATACCTT 


ATGGTTTATA 


TATTAAGAAA 


50701 


O Tv rpmfn TV rp tv rp jv 

LAI 1 lAlAlA 


AAATTC T AAA 


GTAACTTGCT 


TGTACTATTT 


CAATTGAATA 


50751 


ACTTAATGTA 


TTTCATTCTA 


TTCTTCTCAT 


AGTAGATAAT 


AAAAAGTACA 


50801 


TCATGATTAT 


TGTATTCATT 


TATACTTGTG 


GAATTAATTG 


AAAATAGTTT 


50851 


TTATAGTTAA 


AGTCTTTCTT 


TTTATTGTTT 


TACAGGCTGA 


AGAAAAGGCT 


50901 


CATTCAGAGG 


TAAAAAAAAA 


TATGCAATAT 


TTTAATATTT 


TCTATTTTAG 


50951 


TTTGCATTCA 


TGATGAAATT 


AGTCTTGTGA 


CCACTAGAGG 


GCTCTGTGAT 


51001 


ACAATAGCAG 


AACTCCACAG 


GACTGCTGAA 


GTAAGGCAGC 


TAATTGATAA 


51051 


ATGGTCTTTG 


ATATTGCCTC 


TTAAAAATAA 


AATGAAAGGA 


AGTTTGTATA 


mini * 


GCAAGCTGTC 


CTTTCACATT 


pm jv /"* 7v rpmp t\ 

v_ 1 ALjA 1 1 \ji A\j 
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ACACCTAATA 


51151 


AGTTTTCTAT 


AATAGTAAGC 


ACTCATTAAG 


TCATTGATAA 


ATGAAGGTCT 


51201 


ATGGTCTTCC 


TTTT^ T'"^ 1 ^ 


CAGTCTTTTT 


CCCACTCCCT 


GTAAGACCAT 


51251 


CTACACAGGA 


TAATGGTTGA 


AACTTGGGCA 


CCAAGCCTCC 


ACAACACAGG ' 


51301 


ATACTAGCAT 


CTCAGACTAT 


CTGTTTTGTG 


TCATTATCTT 


GTTGCCTCTA 


51351 


ACTGCCATTT 


TATGTGTGGT 


GTGTCACCTA 


TTGTTCTAAT 


CACATATTTC 


51401 


ACAAATACAT 


ATTTGGTTGC 


ACTCGTGAGC 


AAATC AAA C T 


GCATTCAGGA 
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51451 


AAGAATACTA 


TTTTAATTTC 


CCTTGGTAAA ACATTTGTCC 


TGGTCAAAGA 


51501 


GAGCAGGAGG 


ACTTTAATTA 


TGACTTTATT CAAGGTGAGG 


TAATGGCTGT 


51551 


TTGATTGGTT 


TACACTGAGG 


CAATCAGACA ACAGAGAAAA 


AAAATGCCTT 


51601 


AACAACAGCT 


TTTGCAAAAG 


TATTCCTTTC CTTTGAAGTC 


TTATTTTATT 


51651 


AGCCTTTAAA 


AATAAAATTT 


GTGCTATGTT TAAAAATATT 


TGAAAATTAT 


51701 


TGATTAAACC 


AATTTGTCTT 


TATAATCTCT GAACCAAAGA 


GTGGATATGA 


51751 


TT-TTTAAAAA 


TCAAAGTGGT 


TTTATTTACA TCACATGGAC 


ATGACAAAGC 


51801 


TTCTAACACT 


GATCATAGTA 


TAGCTACTGA AGCATCGAAA 


TGCTACATCT 


51851 


ATTTGCCTTA 


GTAGTAGTTA 


TTCAACTCCC CTTTTATCAT 


TGATGCTGTA 


51901 


TCATGAGTTA 


TGGTTTAAAA 


AAACAATTTC AATCACTTTA 


CAGTTTCCTG 


■51951 


GATTATATTT 


TAAAGATACT 


GGAATCATGT AATAGAGACT 


ATTTAATTTG 


52001 


AGAAATGCTC 


TTTGAGTTTG 


GATTCATTTA TGAATAAAAT 


AGACGCTGTA 


52051 


TTTTCTGAAA 


TCATTCATAG 


TCATTATCTT ataaatgtaa 


AGCAAATGTT 


52101 


ATTTTAGACT 


GGGGTGTATC 


TGTTCCGGAA AAAAAAAAAA 


ACAGGAACGA 


52151 


AGTAGAATCA 


CATTTGGTGA 


AATTATATAA GTGTCTACTG 


TTTCCAGCTT 


52201 


AGAGTTCTCT 


ACTTTGTTAG 


AGTGTTTGAG TTGACCACCA 


TTTATTTTCA 


52251 


ACAAAATCTA 


ATGCCCGGGG 


CAAAAACTAG** ACAGTTAATA 


AACTATGTCA 


52301 


AGAATTCTCT 


TTCAAACTGA 


GACAGCATTC CAAAAGTTCA 


ACTACAACTA 


52351 


TAGATAAGAT 


TTGTTTTTGA 


AGAAATGAGA AGCATCAAAA 


GTAGAATGTT 


52401 


TAACATCCAA 


GTAACTGAAA 


TCCCTTGAGA CTAGATATAT 


ACTTATAGAA 


52451 


CCTAGTGTCA 


GATTGTTATA._ AATGTTCTAT CCTTATTAGT 


CACAACATGA 


52501 


G A CTTG C AG A 


ACAAACTGCA 


GAAAGTGCTT GAATTAAAAC 


TTTAAACATG 


52551 


ATATAATATA 


TCCTTACCCT 


TTTCTGTTTC AGTTTTATTG 


GAGTGTGAAC 


52601 


TTAACTAAAA 


AGAAAGATAC 


CTTAGAATAT ACATTATATT 


GGTTTATCTA 


52651 


ATTAGTTGCA 


CCTATCATTG 


GTTTTTTCCC CTGATTTTTA 


AGATGTGGAT 


52701 


AAGCTATAAA 


GCATCTCTGA 


GCTAATAATA ACTCACTAAA 


TAAAGGTCTT 


52751 


GATAATACAG 


ATTTGGGAAG 


GCTTCTCTGC AGTCATTGAA 


ACTCCAGCCA 


52801 


ATAACAATTT 


AAATGTGAAC 


TGATTAAATG TTGAATTAAG 


CCCAAGTTTT 


52851 


AGTGATTGCA 


GGATATTCCA 


TAGCCTTTGA GAAGTTTTCA 


AACTATGAGA 


52901 


AA TTAAAATG 


TACAGAGGAA 


AAAAAAACCT AAGATTTTCT 


GAAAAAGAAC 


52951 


ATGGAGTATC 


TTT TACT AAA 


AAAG AA C AAG AAAAATATGT 


GTGTATATAC 


53001 


AG T TTTT AT A 


AAG AAAAT A T 


TTTTCTACAG TTTTATTACC 


ACAGTTTTTC 


53051 


TAGAAGGAGA 


AGAATCAATA 


CAGAGGGTAA ACTGCTCTTG 


AGTCATTTGC 


53101 


CATTTGAGGG 


ATGGCAAATG 


GAGCAAGTGA GCGTACTTTG 


ATTTGTAGAT 


53151 


TAGAGTTTGA 


CACATAACAC 


TTTGCTTTTG AATGACATTT 


GCTTGTTACT 
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53201 


GTGGAGTCAG 


TGTTCATATC 


CTTTATTTTC 


AGGAGTTGCT 


GCTGATACAA 


53251 


TGGGGTTAGA 


ATGAGCTAAA 


TACAGCATTT 


GCTTTCTTGG 


TTTGAATTCT 


53301 


GGGTTTTAAG 


TAAAAATCTA 


CTTGCCTATT 


CCATTGATTT 


TTTTAATTGC 


53351 


ATTCAGCAAA 


TCCATAAACT 


GCGGAGAGAG 


CTGGTTGCAT 


CACAAGAAAA 


53401 


AGTTGCTACC 


CTCACATCTC 


AGCTTTCAGC 


AAATGTAAGT 


CACTTCATTT 


53451 


TTAAAATATA 


TTACAACAAA 


TTTTTATAGA 


GGAAAATGAA 


ATCATTTTAG 


53501 


TAACAAACTT 


ACAAATTTTC 


AG TGCCTG AT 


ACAGACTTAG 


ATTACCAACT 


53551 


AGCAGGACTC 


AT AAAAAG TT 


AACATTTTTT 


GCCTACTCAG 


TAATAAAATG 


53601 


TAAATC C AAA 


CTGATGAGAG 


GCAGCAATAT 


GGTTAAAATG 


GCTTGTTGTT 


53651 


TCTAATAAGA 


TTGGAAACAA 


TAGTAACAGC 


CATATGGGTT 


ACTTCTTTTC 


53701 


TTGTTTGCTA 


TTTTTATTAC 


TCCTCTTGCA 


TAAGATTCCC 


TGACAATGTA 


53751 


AGAGGGGTTG 


TTAGTGTTTG 


ACTTTGGAAG 


ATAAAATATT 


CCTGTGCCCA 


53801 


GCCTCCTTCA 


TCTCAATGTA 


TTGAACAATT 


TGTTAAGCAT 


CCAGTTAAT? 


53851 


CTAAAATATG 


AAATTAGGTC 


TAAATAGGGA 


■TAGCTTAGCT 


GCACTGTGGA 


53901 


TGAGATATGG 


TTTGCTCAAA 


AAACCTTGGC 


AGCCTTCTCA 


TAG C AATTT A 


53951 


AAAGGGTACA 


CTTTTACTGG 


CACCAGAGCA 


GCCCAGGATG 


GCAGAAATGA 


54001 


TGACAATGAA 


GACCGTCAAT 


TAAATTAACA 


TTTACTGAAT 


ATCTTCCACT 


54051 


GTGTCAGGGA 


GCACTCAGAG 


TAGATGCAGA 


ATGATAAAGG 


AGAAATGTGG 


54L01 


CACTGTTCCC 


AGTCCTGAGG 


AGCAATGGTG 


TTAAGAACAG 


CAGTGAGGGG 


54151 


TAAGGAAATG 


CCTGCTATTT 


TGCCATATGT 


CTTACCTCTC 


TCACTCAACA 


54201 


GTCCTTTGCT 


CAGTTCTGCT 


GCATAGCTTT 


GGGCCTGCTC 


TGTGCCTCCC 


54251 


CACCCCTCCC 


ACTGCTCCTC" TACTGAGTTT 


TTCTATCTCC 


TAGACAAAGC 


54301 


ATGATATGTC 


AAGAGTGAGC 


AGGTGCAGAC 


CCACAGTGTA 


AGACTTGAAT 


54351 


AAGAGCCATT 


TTTAAATTTT 


TTTTAAGCTA 


TCATTGTGCA 


ATATAAATTC 


54401 


TAAGTATGTG 


TATCATTTCA 


TTCACAATGT 


ATTCATTTTA 


GCACTGTATT 


54451 


TGAATTGATT 


TTATTTTCTG 


AAATTTGGGA 


GAATTAATTT 


TGGATTTATT 


54501 


CTATTTATTT 


TTAATAGATG 


GTGTTAGGAG 


ATTCCTGAAA 


ATAATAGCAG 


54551 


TTTTTAGATA 


ATTGTTTAAG 


CAATATGAGA 


AAATAAGGGT 


ATTATTTAAC 


54601 


CTTGTTGTGT 


TTTTAAAGAG 


ATAGTCCAGA 


GGCAACCGTA 


AATTTTATAA 


54651 


TATAGGCTAC 


ATGTATAGAA 


GTATGAAATA 


TTGTTGTCTA 


GGTTCCTGAA 


54701 


TTTGTACCCA 


GAGGAAGTAG 


AATAATGTAA 


ATGTCAGAAC 


CTCCTGGGTT 


54751 


GTGTTTATCT 


GC AATAAGAA 


AGGCTCAATG 


GCAAACCTTA 


TTTATTAGA7 


54801 


TGTCAGGATA 


CTTGCAGATG 


TCTTGAATGA 


TTACTCAGGG 


TTTCATTTTA 


54851 


TTTTTAATGT 


CCCTTGGTTG 


AGCTCATCAT 


ATAATTCAGA 


TATTGGAATA 


54901 


ATAAATGGCT 


GC TAG AC AT A 


GTGGAAGATG 


GGCTGATACT 


TTCCATTTGA ' 


54951 


AATGTAATGA 


TGCTTATTGT 


CTTCAAAAGA 


AAAAACTAAA 


ATGGTATTTC 
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55001 ACATTTTTTT GTTTTTGTTT TTGTTTTTTT TTCTCTGAGA ATCTCATTCT 

55051 TACTCATGAT TATTGGTTTC TTGTGTACCA TTTCAACATT TTTCTATTAT 

55101 ATGCTAATGT GTATATATAC TTAATACACA CGTGCAAAAG CTTCCACACA 

55151 CACACACACA CACACACACA. CACACACACA CACACATACA CACACATACG 

55201 GAACCAAATT CTAACATAGG GGAATAATCT TCGGAGTGAA CTCTGTGCTG 

5 5251 CTG TTTG AAA ATGGAGATAT AATTTTAGAA AGGTTCCTGG AGTTGGCTAC 

55301 CCA.CCTCGTC TGCTCTAATT ATGCTTGTCA CACTATTTTC ACTGATGTGT 

5 5351 TTTCATGACT TTAGGGCATG AATTCTCAGC TGGGTGTTAA TATGACCAAC 

55401 AAAGGGTGAA AACAGGTTCT TGCATTTTTT TAAGTACTCT TTTTATGTGA 

55451 AAAGCACAGA TATGCAGATA ATACATAACT GAACATCCAG CATATCTGTG 

1555 01 GCTTTAAAAT ATCACGAAGA AGAGCACAAT TAGGGAAAAG AAAACATCTA 

55551 TAGTGTTTCC CTAGGGGAAC AATCATTTAA AAAAAAATAA AAATAAGGAA 

556 01 CACAGACTAG AAGCAGCAGT GCCAAATAGA TAATTCATGC TAG TC TTTG T 

5 5651 GTTAATTTAA AAAGTGCTAG TCTTGGAGAC AAACGCCCAA ATTGCTCTAG 

5 57 01 GTTCCACTCA GCTGTATGTG TTATCATTAG TATTAACTTT TGCACGCTGA 

5 5751 TGGGAGACTG ATATATATCC TGTTTTATGT TCCTTTAAAC AATTTATAAT 

558 01 G TAATTTAG A AACCTTCTCA AATCACATTA GATCCACACA AAAACCTGTA 
5 5851 CATAGCAGCT TTATTTTTTA ATAGCCAAAG AAAGGAAACA ACCAAAAATA 

559 01 TCCCTTAATA GGCC AG TTAA TAAACAAATT CTGATACATC TATATCATGG 
55951 ACTACTACTC AGCAATATAA AGAAATGACT ATTGATACGT GCATCAACTT 
5 6001 GGGTGGATCC CAGGGGTATT ATGCTGAGTG AAAAAAGACA GTTATAGAAG 
5 6051 GTCAAATTTT GTATAATTCC ATTTATATAA CATTCCAGAA - ATGGCAAAAT 

,56101 TAAAGAAACA GAGAACAGAT TAGTGATTGC TAAGGGCTAA GGATGAAGGA 

*5 6151 GAGAGAGAGG TAGTGTGACT ATAGGAAGAG GGAGATCTTT AG TTTTG T A T 

5 62 01 TTTGAATGAG ATGGCCATCA CATGAATCCA CATATGTCAA TCTATTAATG 

5 6251 TAAATCAATA TTGTATTCCT GGCTTTGATA TATAATATAA TTTTATAAGA 

563 01 TATATAATCA TTGGGGGAAA CTGGATGAAG GATACAAGGG ACCTCCCTGT 

5 6351 ACTATCTTTG CAACTTCTTG TGTATATAAT TATAAAATAT ATAATGTATT 

5 64 01 AAAATG TATA AAATAATATT TTAAGTATCA, GATACTGATC TTTACTCAGT 

5 6451 ATATGAAGTG TTCTATCATA ACGTAACATG CTTTTCCTTT ATTTGTGGTA 

5 6 501 TTTTAGTTTC AAACTAAAAT ATAAATCACC TAAAGATCTA CGACAGTTCT 

5 6 551 TTTGAAAAAA AATCTTGCTT TTAATTTCCC AGGAGTTTCA ACCTTAATCC 

5 6 601 TCTCTTTAGT GTTTCTTTAT TTGGTAGTGA TAGGGACTAT CAAAGCTTCT 

5 6 651 TACCATCAAA TACATTTACT GACTAAAAAT AGAAAAATAA TTTACATTGT 

5 6701 AAAAATGTAC AAATTGAATG ACAGTCAAAA GGTACAGGTA ATGAAGATAT 
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567 51 GCATTAACAT CTACTTTTAA AAAAAAGTTT ATTAAAATTC TCTTTTAGAC 

56801 TAATGCAGTA TCTGGGAATT TATATAAATA GATATGTATA TAAATGACTA 

56851 TTAAACAATT TTAATGTCAG TTATATTTTA AACATTTTAA TAATATTGTT 

569 01 ATAACTATGG GGGTAAAATT TTGTATATAT CTGAACATTT TTGTTCTTAA 

56951 GGAAATAATC ATTTTTACAT ATCCAGGAAT TTGAATTACT CTCAAGTCAC 

57 0 01 CTATTAATTA CAAGTCATTT TGAACTCATT CATTTTCTTT GTGTTTGCTT 

57 051 TATAATGTC^. TTTTAGATTT CATGCATCAT AATC AG CC AT CAAATAATTT 

57101 AGTTAATACT TGATTTTTCC TCAGTTGTAA GAAGTGCTGT GTTTAAATTT 

57151 CATTCAGAAT GTTTCATTTC ATCTGAATTA ATATCTGTTA ATGTATGTAA 

572 01 TATACACATA TTTTTAACAT GCATGTACTT AAATTGATTA TAGGGACTTG 

572 51 GTAAAATTAC TTATTTATAG G ATATTTT AA ATATAATCAA GGATTTTTTA 

573 01 AATCTACAGT TCCCATTTGA AAGTAAAAGT AAGTGTTTGT TTACTAGTTT 
57 3 51 GTTCACAGTA C AAG T AAA C T TTCTACCTTT TGGTTAAATG TGAGTGCAGC 
57401 CCCCACAGTG AGAAATTGTT ATATTAGAAC TCTAATAGCT ATAATTTATA 
57 451 GGGATGAATT TCAATGAGTT TGGTTCTAAG AAATAATCTG TTGGTTTTAA 
57 501 CAACATTTTT AAGTATCAGA TATTCATCTT TACTCAGTAT GTGACATGTA 
57 551 CTCTCATAGC TTACGTGCTT TTCCTTTATT TGGGGTGTTT TTTATATATT 
57 601 AATTGGTATA TCGCATATTT AAACTTGGCA TAATTACATT TATATGGACT 
57 651 CTAAACAATA ACTTGTATTT TAATTTTTAA ATTTGAAATG CATCTATGTC 
57701 TCTGTTAAAA TGCATTTCTT TCCCTTTGCC CAAATGGGGT ATGGTAAGTC 
577 51 AAGAGAGTCT C TAG TTAGC T CACCTCTCAT TTGACTGGCA GAGTAAAGCC 
57 801 CTTGTTCAGT AGAATGTGTG TTAAGCCTTC CCTCCCTTTT GTAAAGTTGT 
57 8 51 TCTGAACAGA GCTGCATAAA ACCACAGGTA AAGTGTTAAG CTGATTCTAC 
57901 TAGCATGTCC TTAGAAAGGA GAGCGGTTAT ATTGGCAGGT CCTATTGCCT 
57 951 GGCGTTTCTG ATCAATAACT CACCAACAAA CAGAAAACAG AAGCCGCACA 
58001 AGGAAAGGCA GAACTAAATA AATGGTAATA GCAAACAATA AG CC AG AT AG 
5 8051 CCTCTGGCCT CTCGCCCACA CCTTAAGGCA GCTGGGTCAG GTGGGATGCT 
5 8101 TTTGTTTGTC TTTTAACGTA TTTTCTTTAC AAATCTCAGC CATTACATAA 
58151 TTTGGAAATG GACACAAGGC TAGTTATTAC TAACATTTTT AAAGACATTA 
58201 CTGAATGAAT GTGTAAGAAA ACAAAAGGTC CTTTTTGCCT TTCAGCAGAT 
5 8251 • AAGT'CTTTTA ACCAAAAATC TCTTGGGTAT TTTGAGATTG TGTTCTACTT 
5 8301 CTTTGCTTAT TTAATATTTT C A T AAAA T T T GCTAGTTACT CTTGCTTTTT 
5 8351 TGCATCTCTT C T AA G A G AAA ACAATTGGTG CATATTATTA ATGAGAAACA 
5 8401 CTTCAGTGTT TGGACAATTT TTTGTAGTGG AAAAGAAATG TG AAACTTTA 
5 8451 TG TT G C AG AA. TCATTCTTGG TTCAACTAAC TACTAATTTT AAAA CAT AAA 
5 8501 GTCTTAAATA TATATAAAGT TTATATGGGT AAATATATAT T AC AT AT AA T 
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58551 


ATATGTTTTA 


TATTTATACA 


TAATATACTA 


TATATTTATA 


CATGATATAC 


58601 


TAAATATTTT 


CCCATATAAA 


TAATAAAATG 


CTCTAGGCAT 


ATATGTGTGT 


58651 


GTGTGTATAT 


ATGTATATAT 


ATATATACCT 


TCATAACATA 


CATATATAAA 


58701 


ATACTATATT 


ATATATACTC 


TAGGTATACA 


TATATGCCTA 


TATATGCACC 


58751 


TATATATTTA 


TATATTACTA 


TATAATATAT 


AGTATATATT 


ACTATATATA 


58801 


CTACTATATA 


TTACTATATA 


ATATATAGTA 


TATATATAGT 


ATATATTATA 


58851 


TAGTAATATA 


TTACTATATA 


ATATATAAAT 


ATATGTGTGT 


ATATATATAT 


58901 


ATGCCTAGAG 


TG TTTTTAAT 


TTGTCAGTGG 


GCTGTCTCTG 


TAATCTATAT 


58951 


GAAGAAATAA 


AATGTAGACG 


TTATGTATAA 


TGATATTTCA 


TCTTGTTGTG 


59001 


TGGCATCATA 


GTAATTCTCT 


TTACATATCT 


ATTCAGATTA 


CTTTTGCACC 


59051 


AGCCTAATAC 


ATTGTATGAT 


TCCAAAACCA 


AAGAGAGTAT 


GGATTGAAAT 


59101 


GATATTCCCT 


TTACTAATAC 


TCAGTCTTGT 


CTATTTTATT 


ACCTTTATAG 


59151 


ACTTCACCTA 


ACACAAGTCA 


GGGGATATTT 


ATCATCATAT 


TAATACAATT 


59201 


TTACTCTGAC 


CTTAAAATTA 


TGCAACTGCT 


AAAGGAAAAA 


TCAGAACCAA 


59251 


ATAAACTGTC 


ATTAACAACC 


CCCCTGAAAA 


TCCATATTTT 


TTAAAAGTCA 


59301 


TTTTATCAAG 


TCTCTCAGAC 


AAGATGTGAT 


ACCCTATAAG 


TTTAATCAGT 


59351 


TTTACTTTCC 


ATTTTCTCTT 


CATTAAGGTG 


ATAAAGATTA 


TC ATT AG TAG 


59401 


AAAAATTTTC 


CCTTATTTGC 


CTCCTTTTCC 


ATTTACCCTA 


TTGAGTGAGA 


59451 


AATTTAGCCT 


CTCATAACTT 


CTAAAGTAGC 


AATG TTAATC 


TGATAAACTA 


59501 


AACCAAGGTG 


AGATAAATTT 


AAGACAATAT 


T*TTT^^^^T^TTT 


CAACTTTTAA 


59551 


GTTCTGGCGT 


AC ATGGGC AG ^ 


GATATGCAGG 


TTTGTTACAT 


GGGTCAACAT 


59601 


ATGCCATAGT 


GATTTGCTGC 


ACAGATCAAC 


TCATCGCCTA 


GATATTAAGC 


59651 


CCACCATCCA 


TTAGCTATTC 


TTCCTGATTC 


TCTCCCTCCC 


CTAACTCCCA 


59701 


CTGACAGGCC 


C TAG TGTGTG 


TTGTTCCCCA 


CCATGTGCCC 


ACGTGTTCTC 


59751 


ATCGTTCTAC 


TCCCACTTAT 


AAGTGAGAAG 


AAGTGGTGTT 


TGGTTTTCTC 


59801 


TTCCTGTGTT 


AGTTTGCTGA 


GGATAATGGC 


TTCCAGCTCC 


ATCCATGTCC 


59851 


CTCCAAAGGA 


CATGACCTCA 


TTCCTTTTTA 


TAGCTGCATA 


GTATTCCATG 


59901 


GTGTATATGT 


ACCACATTTT 


CTTTATCCAG 


TTTATCATTG 


GCATTTGGGT 


59951 


TGATTTCATG 


TCTTTGCTAT 


TGTGACTAGT 


GCTGCAGTGA 


ACATAATGCA 


60001 


TGCAGGTATC 




AATTATTTAT 


ATTCCTTTGG 


GTATATACCC 


60051 


AGTAATGGGA 


TTA CTGGGTC 


AATTTCTGCT 


TCCAGATCTT 


TGAGGAATCA 


60101 


TCACACTGTC 


TTCCACATTG 


GTTGAACTAA 


TTTACTCTCC 


CACCAACAGT 


60151 


GTAAAAGCAT 




CTGAAACCTC 


TGCAGCACCT 


GTTATTTCTT 


60201 


GACTTTAATA 


ATCACCATTC 


TGACTGCTGT 


GAGATGGTAT 


CTCATTGTGG 


60251 


TTTTGATGTT 


ACCCTTTTTT 


TT AT A TGTTT 


GTTGGCTGCA 


TG AC TGTCTT 
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60301 


CTTGTAAGTG 


TCTATTCATA 


TCCTGTCTAT 


TCATGTCTTT 


GCCCACTTTT 


60351 


TAATGGGGAA 


GTTTGTTTTT 


TACTTGCGCA 


TTTGTTGAAG 


TTCCTTGTAG 


60401 


ACTCTAGATA 


TTAGACCTTT 


GTCAAATGGA 


TAGATTCCAC 


AAATGTTCTC 


60451 


CCATTCTGCA 


GATTGTCTGT 


TCACTCTGAT 


GATAGTTTCT 


TTTGCTATGC 


60501 


TGAAGGTCTT 


TAATTAGATC 


CTATTTGTCA 


ACTTTTGCTT 


TTGTTGCAAT 


60551 


TGCTTTTGGA 


GTTTTTGTCA 


TAAAATCTTT 


GCCCTTACCT 


ATGTCTTGAA 


60601 


TAATATTGCC 


C AG ATTTTG T 


TCTAGGGTTT 


TTATAGTTTT 


TGGATTTTAC 


60651 


TTGTAAGTCT 


TTAATCCATC 


TTGGGTTAAT 


TTTTGTATAA 


GGTATAAGGA 


60701 


AGTGGTCCAG 


TTTTAATTTT 


CTGTATATGG 


CTAGTCAGTT 


CTACCAGCAC 


60751 


CATTTATTAA 


TTG TTTTTTC 


AGTTTCCCCA 


TTGC TTG TTT 


TTGTCAGGTT 


60801 


TGTCGAAGAT 


CAGATGGTTG 


TAGGTGTTTT 


TCACTAACAT 


AATCATAACA 


60851 


TACATTTCAT 


TGAAAACAAC 


ACGACTCAAA 


ATGTTCTTTA 


GTAACCAGTT 


60901 


ATAAG TTTTT 


TTGTGCATAA 


TTACAAACTG 


CCATTCTAAT 


CATAAACATT 


60951 


TTGTGGTTAC 


TTATAGCTAG 


AAAATGTGAG 


TAATATAGTT 


TATACAGCAT 


61001 


ACTCTTTACA 


ATCCCGATTT 


CTTTGTCAAA 


CTTTAATTCA 


TATTAAATTG 


61051 


ATAAAGTATA 


CACAAAGGGT 


AAAGGAGAGT 


AATTTTCTTC 


AAGTTTCACA 


61101 


TTTAAGGATT 


CATAGTAGAA 


TGATTAAACC 


TTACATTTCT 


CCACTATAAG 


61151 


GAGAATTAAA 


ATGGAAATAT 


TGAGTAAAAT 


CTTACATTTC 


ATTTAGTAAG 


61201 


TGCTAATAAA 


GGGTTTCTGC 


CATAATTTTC 


CTTATTTTAA 


AAGAAAACAC 


61251 


ACAATTTTAG 


T^TTAGGTTT 


TAGTAACCAA 


TTTTATGGGC 


ATAGTGGGAA 


61301 


TATTTCTAAC 


AGGTTAAACT 


GAAGTGACCA 


TCATGGGCAT 


ATATATATAT 


61351 


TTTAAATTCA 


CATATATGAA TAC TAT AC AG 


TAAAAACTAA 


CTTATGCTAC 


61401 


ATACCACATG 


GATGAATCTC 


AAAACCCATG 


TAAAGCAAAA 


GAAAACCACA 


61451 


AAAGAATCAT 


GCCATTTGAT 


TACACTTGGG 


TGGTTTTTAA 


AACAGGCATA 


61501 


TC T AAA C ATA 


GTGCTTTAAA 


GTGTAAGCTT 


GGGT A GG AAA 


AACTATAAAG 


61551 


AAAAGCAAGA 


AAATAATTAC 


CACAGAAGTT 


ATGTAGAGGT 


TATCTTTGGG 


61601 


GAAGGAAGAG 


GGAATAATAA 


GAGAGGGACA 


AAGAAGAGCT 


TCTTGGTTCT 


61651 


TGAAATGTCC 


TATTTCTTGA 


CTTGGCTGGT 


GAATGCATGA 


ATGTTCACTA 


61701 


TGTGATAAGT 


CAGGGGGCTG 


TTTTCATTTT 


GTTCACTTTT 


ATATATGTGT 


61751 


GGATTTTTCC 


ACAGTTGAAA 


AGG TAAAGTT 


CAGGTGTGGT 


GGCTCACACC 


61801 


TATAATCCCA 


GCCAACACTT 


TGCGGGGCCA 


A G G TG G G AAG 


AATTACTTGA 


61851 


GGCTAGGAGT 


TGGAGAGTAA 


CCCAGGCAAC 


AGGGTGAGGC 


7-.CTGTCTCTA 


61901 


CAGAAAATGA 


AAAAAAAAAA 


AAAAAAGTAG 


CTGGGCATGT 


TGGTACATGC, 


61951 


CTATAGTTCT 


TGCTACTTGG 


GAGGCTGAGG 


C AA G AG G AT C 


ACTTTAGCCC 


62001 


AGGAGTTTAA 


GCCTGCAGTG 


AACTAGGGTT 


GTGGCACTGC 


ACTCCAGCCT 


62051 


GGGTGGCAGC 


AAGACACTGA 


GTAAAAGAAT 


AAAATAAATA 


ATTAAAAGTT 
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62101 AAAATATAGG AAAAAATGAG CATAGCCTTA TGCTAATTTT TCAG TTACTA 
62151 GGTCTGATAT CATCACATTC CTTGCTTGTC ATTGAAAATT TTTTAAACTA 
62201 TGATACTTT.T TTTTAGTGGT ATTTATCCAA TTAAATCTGC TAACAAATTT 

622 51 GGTGTATAAA TCTCAAGGGT AAGGGTATGT GGAGAGTGGG TGTGTTTGTG 

623 01 TGAGAGAGAG AGAGAGAAGA GGGGGAGGAG AAAAAGAAGG AAGAGGGAAG 

623 51 GAATGGAAAA AGATAATAAA GAGTTGTTCT GATAGATTAA TCTTTAGTAG 

624 01 ATGTATTCCC TACAAATTGT TTTTCTCCAT ATTGCAGTGT CAGGTAAAGA 
62 451 AAGGCATCCC AGGATGAATT CAGAGCTAGG AACATGCACC TTTGTATCAT 
62 501 AATGCTAATG GAAGGAACAT GTACATTCTA ACTGTTACCA ATAATGGAAT 
62 551 ATATTTCCGT TATTAAGTAA TAAGCTTTAA TTCTTTGTAT TTTTGTGATC 
62 6 01 CATTTGATAG TAGGTGCCTC AGCATTTCCA CTCTGCTATA AGTACATGGA 
62 651 GATATATTTT ATTTAAGTCA TC TTATTC AT GTCTTTCAAA AAGAAATTCA 
627 01 TTTTTGGCCA AGGATTTCCA AATTTTGCCC CATATATAGG TATAGTTTAT 
62 751 TATAGACTTC GTTTGCAAAA TATTAAATCC TTATATCCTT TTAGGGACAC 
62 8 01 AATAAAATTT TATAAGTTTG AGATAATGTA CTTGCAGTTC TACCTCAGGC 
62 851 CGTGGTGAGA GATTGAAGTG CCTCTTCATT TTAACATTTT GGGTTCAAGT 
62 9 01 TGTTGCATAA GGGCATGCAA ATGGAAACTG GCCTATTTTT GAG C TTTAA T 

62 951 AAAATCGTCA AATACTTCTT AATCTTAAGA GTTATAGTTA TGTACTACAA 

63 001 TATGTATAAT TCTCTAATAT TTAAAACAAA ACCTGAAAGC CACAAAAGCT 
63 051 T A C TG TG AAA TAAAATG TG A TGGAATATTA TTTCTAACTG GCTTACCTGT 
63101 ATTTCCTTCA TTGAAGGGAA. TATGAAGTAG AAAAGCCCTT TTATTGAAAA 
63151 GAGTTTGGAA AGTAAAGATA ACTCTTTTCA ATTCAATTCT TTGTAAG TAG 
63 2 01 AAAAAG AG T A AAGATAATGT TTAGCTGTCA GCAGATGTCT GACACTTGAT 

632 51 GGAGCGTATC ATTACAATAG AGCAGCTAAC AATATCTGCA AAGGTCATCA 
63 3 01 TGAAAGTATA AAAATGAGGA- ATATTTGTCC ATTGACCATT TCAGTGACCT 

633 51 CTTTTTGGGC TTTAAGTCTA AAAATC TTGG CAGATCAGAA CTTTATATTC 
63 401 GGCATTTTGA GTGTCAAATC TCTACATGAT GTGCAAGTCA GAAGGAGTTA 
63 4 51 TTACTTGCAA AATACCATCT TCTTTCAGAA GTTAAACTCA CATTAAATGC 
63 5 01 CAGGAGACTG AAACACTGAT TTTAAGAAGA CAAAGTTTAG AAAAGATGAA 
635 51 TGAAAATGTG TGTTAAAGAA GAGTCACCAG TCAGAGCTAA CTATGATAGT 
63 601 CATAGTATTT AAAGAGTTGG AACACATGAA ATTAAGCATT TTGTAAAATG 
63 651 AAGGCTTTTC ATCCATCCAC ATAAGATTCT G A C ATTTAAA CTATGTTTCT 
63 7 01 TCCATTCTGT TCACAGGCTC ACCTTGTAGC AGCTTTTGAA AAGAGCTTAG 
637 51 GGAATATGAC TGGCCGATTG CAAAGTCTAA CTATGACAGC GGAACAAAAG 
63 8 01 G TATGTTC AG AAATTGCCAC TGGAGACTGA AAG AAG AC AG CAAATTGCAT 
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63851 


AGGATTCTTA 


AATAATACCT 


GAAGCTCCTT 


AAAAATAATA 


TTCCAGGCTG 
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TAATCTCACC 
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GTGTGTGTGT 
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AATGTGCATA 
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TTTCATCTAA 


TTCTCAAAGA 


65001 


GACCCATTAT 


ATCAGAAGTT 


TTGGGTATTT 


TC AAGAATG C 


GTTCCTCTAT 


65051 


CTATCCATAG 


GAATGGCTTC 


AGTTTTGTCT 


TTAGATTCTG 


TAAGTTATGT 


65101 


GATTAGCTTT 


A C AAAAG TAG 


TATG TATTAC 


CAAATTTTGT 


CACTTTACAA 
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GTCTCCCTCT 
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TGCTGCAGCT 


TGTCACTTCA 


CTATGTAATA 
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TTAGAAGGCT 


TTTTAGAGCA 
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AAGAATAAAA 


ACACTGGCCC 


65.601 


CCAGTATTCT 


TGAATGAGAA 


TTCTGGCTAT 


GTCTGTTAAA 


AGCTGGGTAA 
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65651 TCTTGAGCAA GTTTATCTAA CCTTTCTTGA ACCTCAAATT CACCTTCTTA 

6 57 01 AAAGTGGGGA TGATAATGAC TACCTTGTAG GATCACCATG AGGAGTAAAT 

65751 CAGATACTGT TATCATGTCA CATGCTAGGG GCTACCAAAA AATATTACCT 

65 801 TCCTTTACAT TTCTCTTTTT CCCTTGAAAA TTATAAGATA ACACCAAATT 

65 851 CCTCACTGGG CATATACCAA GCATATTGTT GGAAATGAGT GTTAGAATTT 
659 01 AAGTCTCAAT ATCTTTAATA AGTCAAAATT AATAGAATTT TTGTCCTCCA 
65951 CCQAATATTT TCTTGAACTC TGTTATATCT GTAAGTGAAT TTTCTCATAG 

66 001 AAACATACAG AGAATTTTCT CATATACATA TAGAAAAAAA TGTAGAGGTA 
66051 TGTTAATGTA TAATGCCTAT GATTAATGCC TGAATATTTA AAAATAATTT 
66101 CTATAACATA AGAGATTTTA TAATGTGTCT ACATAATCCT TAAAATAACA 
6 6151 TTGCCAAAAT TATAAAATTT TCTCAGAAGA TATCAGAATG TCTCATATTG 
6 6201 TCCTTATCAC TTTTTTAACT GAAAATAAAA TCACTTCTTT TTGAATTGCA 

662 51 AACTGTATAC ACACAACAAT CATGGTTAAC TAGTTTATTA ATTTGAGATT 

663 01 ATAACTTGCC TATTCTCAAA GTGATATTTA AAAGCCTATA AAATTATTTG 
6 6351 CAATGTGAAA TGGTATAATT CAAAGACAGA ATCTAATTAA AACCAGTAGA 
66 401 A TAATG TATA TAACAATATA CCTCAGCCTA G ATAATT AC T ACTGCAAGGC 
66 451 ACTGAAATGA ATTGAATTTC AAGGAAGCTA TGGTACAAAG GGAGATTGTT 
66 501 AGGTGTGTTT TATTCTCATT TTCTGACCAG GAGAGCATAA TTTAGAC TG A 
66 551 GGAGAAAACT CTTTGGCACT AAATTCAAGG ACGAATTTAT TGCCAAGGTT 
66601 TTTAAATTGG GGTCATGGAA TAACAAAAGA CAAAATCACT GTTCAAATAG 
66651 ACATTTCTCT AAAAGCTAAG GGCATAACAT TTAATCATAT TTCACTAAAG 
66701 GCATTTCTTC AGGGAGCTGA GATAAAAGGG TATATTGCTC TCTGGTGATT 
66751 CAACAATCCT GAGAAAAGGC TTGTGAAGTA TAGAGCAGAG ATTCTTAAAC 

66 801 TCCCTTCCCC AAGTTATAAG TTTCATTTGT CTATATAGTC ATTCATCAAG 
6 6 851 TTTATATTGA ATTTGTGCTC TTCTAATGAC AAAACAGTAC AGACAATATA 
66901 GATATAGAAT GATAGATATA GGTCTATATC TATAGACATA CCTATCTACT 
6 6951 AGAACTCTAA AAGCATATTA TACATGTATG TAATATTCCT CATGGAGTTT 

67 001 ATATTTCTCA TATATATCTC ATATATATGT ATCTCTTTAT CATGGAGTTT 
67 051 ATATTTTAGG AGGTCACAGA TGATAATAAA AATATAATTA AAACAGGCCA 
67101 GGTGTGGTGA CTCACACGTG TAATCCTAGC ACTTTGAAAG GCCAAGGCAG 
67151 GTGGACTCCC TGAGATCAGG AGTTCAAGAC CAGCCTGGCC AA CAT AG TG A 
67201 AACCCCATCT C TA C TAG AAA CAAAAATTAG CCAGGCCTGG TGGTGGGCAC 
67251 C TG TAG T C C C AGCTATTCAG GAGGTTGAGG CAGGAGAATC ACT TG AA C C T 
6 73 01 GGGAGGTGGA GGTTGCAGTA AGCCGAGGTC ATGCCACTGC ACTCCAGCCT 
67351 GGGCAACAGA GCAAGACTCT GTCTCAAAAA AAAAT A T ATA TATAT AAT AT 
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67401 


ATATAATATA 
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GTAGCTGTCA 


68751 
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69151. 


TTTGGTCAAT 


GTAATTTATT 
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TATATATTAT ATAATATATA TATAAATTAC 
TATATATATA ATATATAATT AAAACATATA 
CACTACTGAA AAAAGTAAAG CTGAGAATGA 
GGAAGCTAAA AC AC AAAG TA ACAAAGGCCA 
TTACATACTT TAAAAATGGA TAAACTAAAT 
TTGGGCTTCA CAGTGTGATT TTCAGCAATC 
AACTACATCA AAATTGTCAT TTGATTTATA 
ATAGAGAGGG ATTCACTCCT AACACTTTTC 
ACACGGAATC TCTTGCCAAA TTTGTGTGGC 
TTATAGCCTG GTAAGAAAGA AAAGACATGT 
AAAATTATCA TGCTATTAGA CTCAGTACAA 
GAAACATCTG CAGAGGCAGG AGAATTGCTT 
GCACTGAGCT GAGATCATGC CACTGCACTC 
GACTGCATCT CAAAAAAATA AAAATTACAA 
TGATCAATCT GGCAGCATTT TCTGAAAGTT 
GCTAAAAGAA GACATGTTAT ATAATACTAA 
TAAGAGAATT GTTAATGTGC TTGCTGGGGA 
T AC C C TAT AC CTAACCTAGG ACTCAGTAGA 
GACCAAGAAT TTTATCCTGA TTTCAGATCG 
CTTCACCAGG ATTATATGAA AAAAATTAAA 
ATTATATGTG CTGAAATAAC TTCTTTTCTC 
CTATGTACCA CTCTTGTCAG AATCAAGGAA 
GCAGCTTAAT TTTCTCACAG AAGGCCAGTT 
GAATCCAGCA AACTATATTT TTTATAAGTA 
CTAAATCCTT GTGTTCAAAT TTACTAAAGC 
TCAGAATTTA AAATTTAAAA GACTTTCAAA 
TGCCAApGCA ATTAGAACAT ATGTTAAGGT 
GAAGGTCAGA GCAGGGCAGA GAAGTAGCCC 
CAGATATTGA CTCCTATGCT AAC CAT AAAG 
TTACCTCTCT GAAACATTTT TTTGGGTGAC 
CTTCAAAATA AGGGAATTTG AAACCAAATC 
CAACTAAAAA TTTAGTTGAA TAAGATTTTT 
ACGTTATGAT ATTTGCCATC TAGAAGTGTT 
AGTCAGATGA TGCATCCATT AATCTTTGGG 
AAAATTTTCA AATTATTTAC ACTACTGGTA 
TGAAACTAGA TGCAATAGGG ATGGCCAGGT 
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69 201 TATTTCAGTA GAACAACTAG CAAGACTTCA GATGCATGGT GGAGTGGGGA 
69 251 AAGGAGGACC TGTTTAAGGA AACTAGAGCT GGGAAGTGTG AGATTAACTT 
693 01 AGTGCCAATG TGAGGACCTA AAAAGCAGAT GTGGTGGAAA ATTTAAACAG 
693 51 GCTTGCCTAG AAGGTCAAGT TAGTTGATGA CACTTGATGA GATTGTCCCA 
69401 AGCTTTGGGA TTCTCAACAA AGTCTTTGTT AG TGAG AAAT TTGGAAAGAG 
69 451 ATCAGGTATA GTTAAGAAAC TGGGTTGGAA AGGCCACCAG GAAAGGCGAA 
69 501 TATTCTGACA CAAAATTTGA TCATTTTATT TGGAAGCATT TCAAGCCTGA 
69 5 51 CCTGAACGAA TTGTTTAGCC TCAGATACAT GCATAAAACT GTGAAAAGAG 
69601 ACATTGACTC AATTTAGCTT CTTTAACATG AGAAACTTTC GTGGAAAACT 
69651 AGAACTTTAC AAGCTCAGCT GGTGTTGGGG GCATCATTAT CTTGAATAGC 
69701 TCACTGGAGG AAAA.TGAAAT CTTAGTTTGG TTCTCAGGTT TTAAAATATC 

6 9751 TATCATTTTT GAAAAGTGTG AAGTAACAAA ATATGATCTG ATTATC TT AT 
69 801 TCCTAAAATC CTTTGCAGAA TTATCCCAGC CTCAATCTTC TCTTTAGTAT 
69 851 TTAATGAGAA TAAGAAACTG GAAATGACTG AATTGGAAGA GTAGACTTTA 
69901 AATCCATATC TTGATGGCA-T ATACATTTTT CAGTTTTTTT TCTAAATGAT 
69951 TAATGAGGAT TCTCAAAACT TGAGTATCTT CTATGTTTCC CTTCAACATA 

7 0001 AAGAAATTGT ATGA-AAATAT TTTAAAAATT TCTAATGATT TTATAG TTAG 
7 0051 CTATCTTGGG AATTCATTTC TAATCATGTA CCTCATCCAA ACTCCCCACT 
70101 ATGGACAAAA ATAAAATAAA AATTATTAGT TGCATCTGAA GGCCACATTA 
7 0151 CAATTTCTAT GCATTATAGA AACCTGAGAA AATGTATCTT AAAAAATAAA 
7 0201 TGTGAACAAC TAACCATAAT„ TATGAAGAAG AAAAA TG AAA ACTAGAAATA 
7 0251 AACTATTGAA AAATGTCTAT GTATC AG TT A AG TTTTTATT TTAAAATTCT 
7 03 01 TTATGTTTAT CTCTATAATA CTATTGGGAA AGAGAGAAAG GAAAACCTGA 
70351 CTTTGTTCTC ATCCAAAGGA GGTGATTCCA CTGATTTAGC CAAAATAAGA 
7 0401 CTTCCTGGTT AT AA TAAAT A ATAAAGTTTT TGATGTTTTT TATATGGTAC 
7 0451 CCCACTCACT AGGTGATCAG ACACCCTCCT GCAAAAAAAA AAAAAATACG 
7 0501 TATGCAATAA AGTTAAAGTT TTATGTTATT CTTTCAAGGG GAGAAACATC 
7 0551 TGTTTAACAC AGACCAGAAT ATTTCAACAA AGTCATCCCA ATATTTATGG '' 
7 0601 AGATCATAAA TCAAGCGAAA AAATATATTC ATCAACAACT AAACAAACTA 
7 0651 CATTAAATAG TCTCAAAGCA CATTTTCACT TTTTTTCTGA CAGGAAAACA 
7 0701 GGTTTCACAA GTGTGGAGAC ATTTTACCAT GGCTTTTAAC AGTGAGGAAG 
7 0751 G A TG TTT AAA T AAA G G G AAA AATTATATGG AAAGCTCAGA G AAAAG AG A T 
7 08 01 GGGTGTGGCT TGAGTGACAA GGTGAGAGCA GATCTCATTA ACTGAAATGA 
7 0 851 GAGAGAAGGA AGGAATTTTG CAAATATGGA AAGATAACTA GTGCAAGTTT 
7 09 01 GAACAGATTA. TGTCAATCAA TGTAGAATTT GGCTATCTTT TTAATCAAAG 
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7 0951 AAGACTATGG AATATTTTAT AGGTG TTTGC TTATACTCAA AGTTTTAAAG 

71001 AAATAACAGT ATGAATTTGG TTGAACTAAT TTTTTTCATA GATAGGATTC 

71051 TCCCAAGTTA. TATAGCATAT ATATTTCTTA ACTAGTTATT CTTCCTTTTA 

71101 CATATATTGT GCCACATTGA GTAACAACTA ACCTGCTAAT AGCTATTGGT 

71151 TTTTAAAAGA TAATTAATAT TAGAAAGTGA TCATTTTTCT GTTTCATATT 

712 01 AAACATGATA TTCTGAAAAA GCAACATTGC CTGAATGTTC TACATTTTAT 
71251 CTTTTTGAAA ACAGGTTTTA TAAGAGATTT CTTGTGAAAA GCTGAACGTT 

713 01 CTGACACTGA AATAAGTCAG CTAAGTCAAA GCTAAGCTTA ATTTTTTGAC 
713 51 ACTGTTGGCA TGAGGTCTCA TTCCCAATTT TTTCATTTAA AGCCACAGGC 
71401 AAATGTTTTA ACAGATTTTA ATCCGTAGTA CAAGCATTAT TGATCTTAAA 
71451 TTTAAGGATA AAAACCTGAT TTTAATTAGA ATTTAATATG C ATTC TAG TA 
71501 TTTACGTTGT ATAATTAATA TTTACATTCC ATGATTCCAC TATGTACCAT 
71551 TTATTTCTTT TTGAATAAAT TTCCAGTAGG AGCAGAATAA ATTTTCAGTG 
71601 AATATTTTAT TTCTTGGGGG ATATTTTTAA ATGGAAAATA TATTAAGTTT 
71651 CGGTAAAATC TGTTGCTAAT TTGGCAGTGG ACAGAATATA AAAATTGGAG 
717 01 AGACTGAGTC ATTATGATGA ATTGGGTCTG ACTTTTGTCA TGACACTGGA 
717 51 AATTTCCCAC &AATATTATA TTCTTCTTTT ATAATAAATA TAG TCG AAAT 
71801 GAATTGCAGT CAAGTATTTG AAGACCCATC TATAAATTTA GGCGGTTACT 
71851 GTTGATTTTT CATTATGAGA GATTCTTCCA CTCATAAGCT AC T AAAAG T A 
71901 CATAAAGAAG GTCTGGTTGT TTGTTTTAAA TGTGACTGTT CTCTATCAGG 
71951 AAAATGTCAG GTATCCGATG AAAATAGATA TATGAGGTGC CAGGTATCTA 
72 001 TTCCAAACTT GGATATC ACT ' TCAATTAGCA TCATCTTTTT TTTTTTTTAA 
72051 AGTGTCTAAG GTTAGAATAG TC AC C AG AT A TTCCCATGTA TGAAGCAATT 
7 2101 TTCTGCAAAG GCCGCTGTGG ATGATCTTTT TAAAATATAT ATTCTGGGAG 
7 2151 AC ATTG AG T A AAGAGAAATT ATTTACCAGA GAATGAAGAA CCGAGGCCCG 

722 01 ATTCTTTGGC TTTCTGCCAA AGATGCTGAA GGCAGTGATG" AATGACAAAT 
7 22 51 ACATTACCAA GGAATTCTCC CTCTAAGAGG CTGACAAAGA TCTGATTTTT 

723 01 AGGATTATAT TACCACCAAG AAGATACCCC TTGTCACTGA GCTTCTAATG 
7 2351 GAAATATGGT CTATACTGAA ACAATTCTCA GTTCTTTTTC TTTCTATCTT 
7 2 401 TTTTTG AG TT ATTTTATCTT CCAAAAATGA GTTATTTCTG ATAAAATAAT 
7 2451 TC AC T T AAA T AATTATGAAA GTTCAAATTT GTGCAAATAT TTTTATTGGG 
7 2 501 ACATCTTAAA ATTAC TC T AA ATTC AAAAAG AAAATATATG CTTTATTAAA 
725 51 ATTTGATCTG TAAGCTGCTT TGTTTGTAAT TTAAC TATTA T A T AAAAAT T 
7 2 601 GTATAAT AC A TATATTTTAT TTACTTTATT CCTGTGTTGC TTTGGCTTGG 
72651 TGAGACTAGG TCTCCACATT AGGAGTTTTA CTGAATGAAA AAGTATCAGA 
7 27 01 ATGTAACATG ACTTTGATAT GGCATCAGAA TTTAATAAGA TGACATTTAA 
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72751 TAGGAATTAG GGGTAAGTTC CAGGTTTTAC ACTTAAATAC AAATAATCAA 
72 801 TTTTGCAGGC ACAAAATACT TCAAACAAAA TCTGAAATCA TTCATTTGAC 
72 851 AAAAC TTC AG GTTTGCAGTT GACAATAAAT ACAATACAAT GCAACAGTGC 
729 01 AATAGTGATA TCTAAATATC TAATGTAATC ATAGGTAATA TTAGTAAGTG 

72 951 TGTTATCTGA AATGAGTGGT GTGATATCCT GCTTTACTTT GTACTGGTGA 

73 001 GTTCTGGGTG CCACCTTTGA AAGGAATAAA GACTATTCAT ATCTCTTTTA 

73 051 TA&GACAATA AGAAAAACAA ACAAACAAAC AAACAAAAAA CCACCTCCTT 

73101 TACTTTAGCT GAGAAAGAAG TTATTAGGTA CAGCTTGACA AGTTCAGCTA 

73151 AGCATCCAAA TCTTCCAGGA GGTTGTTACT ACATAAAATC AAAC CTTTTT 

73 2 01 AATTCAACTA TGAGCAGGGA GATTTTATTT TTCTTTCGGG TACTAAAGCT 

7 32 51 TCCAAACTCT GTTTATTCCA CAGGAATCTG AACTTATAGA ACTAAGAGAA 

7 33 01 ACCATTGAAA TGCTGAAGGC TCAGAATTCT GCTGCCCAGG CGGCTATTCA 

733 51 GGGAGCACTG AATGGTCCAG ACCATCCTCC CAAAGGTATA TTTAGAAATC 

73 401 ATTTCATTTC CACCCAATAT AATAGGCATC TATTTTATTT ATTAATTACA 
73 4 51 GTAGAACTGG ATTTACTCAG TGTCACTGTG CATTATTAAT AC AT AC TAG T 
73 501 TGTATTAATA GTTGTATTAA TACATACTAG TAGTATTAAT ACATACTACG 
73551 TTGGTATTAA TGTGATCAGA ATCCTAGAAT TTTAGAACAG TGACTTCCAT 
73 601 TATCAGATAA TTTTTAAACT GATCTTAAGA AATTTGGTTC TATAGTTGT A 
73 651 T AC AC ATC TC TCTACTTGAT TCAGTGGAGA TGGAGATGGA GTGGTTGGTT 
73701 AATACATGCA TATCTGACTT CAGGCAAAAC AAACCCATTA ATGAGTATGA 
73751 T AATC TAG AT C TG TATTTAA AAATGAAATA G TC AATATGA TGATATAGTA 
73 8 01 AGCAGTGGGC ATTGGGAACA ACTTTTCCTG GATGGAGGCT ATAAAAAGGT 
73 851 ACATTTCCTG TAGATAATTT TGAAACAATA AAAACAACGG GTGAAAGG T A 
73 901 GCTCTGTTTT AAA TT ATTC C TATGCTTAAG CAATTCTAAA CAATGAAAGG 

73 9 51 GGTATTTCTG CCACTGCCCC TACCCCTGGG TTCACCACTG AAGAAATGCT 
7 4 001 CATTATTAAT ATCGTGTCAT TTTTTTCCTT TACATTGGTT CTATTTACTC 
7 4 051 ATTTCCTGAC ACTTTTCAAT GGCCTTCAGT GAGCTCAGCT CTTTCCCAGC 
74101 TTAAAAAATC CTGTCCTAAA ACATGAATGC CTTATTATCT CTCTTTTCAT 
74151 TTCCAGAAGA ATTC TG A G AA AAATTTTATG AAGTCTTTCA ATGTCTTCAG 
7 42 01 CCATCTTTAG ACCACTGGAG TGTAGCTCCT TTTCCCTCCA CTCCACCAAA 
7 4251 ACAATGCTCT CCAGGATCAG CAGAAACTTA CATGACACTA AATTCAGTAA 

74 3 01 AACGTTTATA ATTCTTATTG TATTAGACAG ACATGGAAAC AGCATTTGAT 
743 51 G C TG AT ATT C ATTTCTTCCT ATGTGAAACA TCCGGTTTTT CTAATGTTCG 
7 4401 TGACATCATA CATTCTTGGT TTTTCTTCTG TTCCTTTGAA ATATTTTTTC 
7 44 51 AATATTTCTT TTGTAAATTC ACTCTTTTGT ATCCATTTGT TAATTGTTGA 



Fig. 2 (Forts. 41) 
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74501 


TATCCTAAGC 


TCTCTTCCAT 


TATGATTCTA 


TGCATCCTAT 


TTAAAATATA 


74551 


TAGAAAATCA 


TCTCATACTC 


TAGCTGTAAT 


TTTTATTAAT 


GTGCTAATAG 


74601 


CTAATAACTG 


TCAAATCTAG 


GTCTCCAGGC 


CAGGCTCTGT 


ATATCCAGCT 


74651 


ACCAAGAGAG 


AACTCCACGT 


GGATATCTTT 


GGATGTCTGT 


TTTGCATCTT 


74701 


AAACCTAACT 


TC.TC C AAATT 


TGCACTTGTC 


TTCTGTCTCA 


GACCTGCTGC 


74751 


TCCTTCAGTG 


CTCTTTGCCT 


CAGTAGATAG 


CACCACCATC 


CTTCCATTTA 


74801 


GCCAGAAATC 


TAAG TATTCT 


TCATAACTCC 


TCCTCTCCTC 


ATTGAATAAA 


74851 


TTACCAAGAT 


CCGTTGATCC 


CATTCCTTAA 


ATATCTCTTG 


GATCTGTTAA 


74901 


CTTTTCTCTG 


ATTTTACTCT 


TGCCATCCAT 


CACCTCTCTC 


CTGAACCATG 


74951 


ACCACAAACC 


CCTAAATAGC 


CTTCCTCTTC 


TTAATCTTAT 


CCTGCTTTAC 


75001 


ACCAGTCTTC 


ACGCTGAAGC 


CAGAATAGTC 


ATTAAGAAAC 


ACATCTACAG 


75051 


GTATCCCATT 


CATTGCCTTT 


AGAATGGAAT 


ACAGACTCCT 


CAGCATGACA 


75101 


TAATCTCTCT 


TCACCAGCTT 


CATTTATTCA 


ACAAATATTT 


ATTCATAACC 


75151 


AATTAAGTGC 


CAGATGATGC 


ACATATAGAC 


TTCTTGTTCT 


GTTGTTGCAT 


75201 


TGCATATTCC 


ATATTTCAGC 


TATCCTGAAT 


TGTTTTCAAT 


TA.TTCATAAG 


75251 


TTCTTTATGA 


ATTG TGTTC A 


TTCCATTTGG 


AATATTCTAC 


CTTGTTTGAT 


75301 


CAGCATAAAG 


ACTTTTCGAG 


ACACTGCAGC 


AG C AG TGAAC 


CTAAATATGT 


75351 


TTCCTTGACC 


CCTACATTGA 


ATGACACCCC 


CTGTGATATG 


TTTCTGGAAG 


75401 


CAGCAATACT 


TCCCTTCTTA 


AAATTACATT 


ATACTTTGGG 




75451 


AAGGTATGTC 


TTTCCTGATT 


TACAATAGTA 


GAGCTTGTTT 


TTTCACCCTT 


75501 


TTGAAAGACA 


TCAAGATGCC 


CATGATGATG 


TCTTGCATGT 


AACAGGGGTT 


75551 


TATTTGAATT 


TTTAAAAGAA 


GAATAAAGTA 


ATTTTTAAAT 


GAATTTCAAT 


75601 


TT AAA T TT T A. 


GGAAAACAAT 


TATATAAAGT 


GAGATATGCT 


TAAA.TTGAAG 


75651 


G AC AAAG TAG 


TTCTGTAGGG 


GCTACTTCTT 


TCAAGACTTT 


AGCAACTTTC 


75701 


CATGTGGGGG 


AGTGATTTAT 


GTGATGCATG 


GAAAATTACT 


GCATATTTAA 


75751 


AGCTTATCTT 


AGAGCTATAA 


TAAAGCAGCT 


TATGTTCTAA 


ATCTTCATGT 


75801 


CGTAAATAGG 


TCCAGAAGGG 


ATTTAAAAAG 


CCTTAATCCT 


TACTTTAACA 


75851 


CAGCACAAGT 


C AC TG AAG TG 


AAACTTGCTG 


AAAGGATTCC 


TTTTATGTTA 


75901 


GGCAACAGGT 


AGCTGAATAT 


ATCTACAGAA 


ATTGAAAAAT 


TGGAATTCTT 


75951 


TTGCTCAGAA 


ATGTGGGAGG 


GGTGGAGCTT 


AAGGTAAAAA 


ATAACAGTTA 


76001 


ATATCTAAAT 


TG A T C AAG AA 


ATATGAAAAA 


ATAATTTGCT 


AGGTTTTAAA 


76051 


ACTAACAAAA 


ACCATGGTTA 


TAAAGGTTTG 


AATATATATA 


GGATAGTTAG 


76101 




TG T AATATT A 


AAACTCAGCA 


TTAAATTTAA 


TGAACACAAA 


76151 


G TG A TT C TT A 


TCACATTGAC 


CATTGACATT 


ACATGGAAAA 


AATAGTCAGT 


76201 


TGGACTAATT 


ATGTGTCTTT 


CCATGGGTTA 


TTAAGGTAAT 


TGTATGGCAT 


76251 


A T AAATTT AT 


ACTGGAAATC 


ACATTGAAAT 


TCACTTTTAG 


AGGCCCTTAA 



Fig. 2 (Forts. 42) 
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7 6301 AATATTTCTG TAATATATAT TTTTAACATA TGATCTTAAA AGATATATTT 
7 6351 GGAATGACAC AACAGTTTTA TAGACAGGCC TGACTATCAC ACAACCACAC 
7 6401 ACCAATTTGT. GAATGTGTTT CTATTTCCTC TAAATTAATG CATCACATTC 
7 6451 ATTAACAAAG TTTGATAAAT GACTATAGTC TATAATAAAA TATTTTTGTT 
76501 TACAAACATA TTTAAACACC TGCTATTAAG TATAGGCATT ATCAGATCTT 
7 6551 AAAATACAAA GATTTAAAAA ATTACCCTGT GGTCATGGAG CTCACAATCC 
7 6601 ACTGCAAAAA TAATGTTTGT GATAAGAAAT TTGAAAGTTG AAGG TAATAG 
7 6651 AAAATTTTAC C TTTATTTTT C AAAATG T AC CATTGCTTTC TAAGTCACTA 
, 7 6701 CTTCTGTGTA AATA.TGGAAT TGTTTTTCCT TAAGATATAC CAAATATAGT 
7 6751 TGGATAACGC ATGTATTAAA ATTCTGTCAG CACTAAGTTG TTTTTTAGAC 
68 01 ATAGTGATAG GCAAACATAG TTATATTGAA TGAAAAATTA GAATCAAATT 
7 6851 TATTAAACAC TGTGTACTGA TTGATACCAC ATGCCATATG CTTGTATAGC 

7 6901 AATACAAGGT TTGGAATTTA TAATGGTAAA CAAAATAGAT ACGGTCTTTG 

7 69 51 TCTCCATAGA ACTTTTAGTC TAGTGGGAGA GCAGAAGGTA AAGGAATGTA 

7 70 01 TGTGATCATT GGTGAAGCTG AACATGTATA CCCAAACAGT TATAAGTTCC 

7 7051 AAGATGGACA ATAATGGGTG CCATAGGGAA GGAGGGTACC AAGGAACCTA 

77101 CTGGAGGTTA CATAGGGAAG ATTATTCCAA GGTAGTAATA TTTAAGTGAA 

77151 TATCCAAGGA ATAATTG TC A ATCACTTTAT AAGTACTGAG GGAGGAGTAT 

77201 TTCAAAAGAG CTTTGAGGCG GAAAATAAAT TAGTTCCTTT ATGGAACTAA 

77251 TGTAAGGAAA ATACTAAGCA AACATGTAAT AAGAAGAACA CGGTTGATGA 

7 73 01 GTTAAGAACT GACAAGATTA . CTGAAGGATT GTAGGCCATA TTTAGAAGTT 

77351 GGATTTTTTA TCTATTCTTA TTAAAG TGAG AAGTTATTGA AAGGTCTTAA 

7 7401 GTGGGGGAGT GATGATGAAG TTTG C C TTTT AAAAAAGATT TTTCTAGCTA 

7 7451 TTG TTT AT AG AATGG TTTG A AGATGAATAA GTCCAATAGC TATACTTGCT 

77501 GTAAAGGTTA TGTTGGTAGC TTGAACTGGG GCAGTGGTGA CACAGAGGAT 

77 5 51 GGGAGATGGA AAATGACGAG TGAACAAACA CATACCTGAA AATTTAAGTT 

77 601 TAAAAATAGA CCTCTCCATT AATTCAGATT GCTGATATTC ATTCGGTTAG 

77 651 CCATTCTTTA CTGAACTTTA TGATGCCCCA TATACTGAAT TAAATACTTA 

777 01 CAAGCACTAA AAAAGAAATT GTTAGGGAAC AG T AAAATG C ATTTCCTTCA 

777 51 TTTCACAATA TTATTAATAT TATGGCTTTG CTAATCTTTA TTGGTGAATG 

77801 CAGTCATAAT TGAAGGTAAC TGATACTTCC AAGG AC TACT TTTGACCTAG 

77 851 GATTACTATC TTTTTAAAAA TTTAGTATTA AAGAAGTCAA A C A C AA TTT A 

7 7 901 TTAATTCTGG AT AT AA T AAA AATTC TG AAA TACTTTAATA CTTTGTGCTT 

77951 TTCTATTTGT GAAAGTTAAT TATTAGGAAC GAGCTAGCAA ATGCTACTTC 

7 8001 TTTTTCAAAA AG CT AATGG C CAATCACAGC AAAAATTTAA AGCACTAAGA 

Fig. 2 (Forts. 43) 
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7 8051 


AATACCTACA 


CATATTCTTC 


TATTGCCCAT 


TTATATGACT 


TCCATAATAG 


78101 


TTGATTAAAG 


GATACCGGAT 


TCCTTTATTG 


TTGAATTAAA 


ACCTCCTACA 


7 8151, 


TGAAAACCTT 


GATTTAGGTT 


TAGAAGTTGG 


TAATGTTTTG 


GCATGCAAAA 


78201 


CCAGTTAATG 


TTCTCATCAT 


TACTTTTTAA 


AACAATGTTA 


AGAGATGAAT 


78251 


TCTAGGGATT 


ATAAAAAAAA 


AAAAGCTGTA 


TGTGTTTCTT 


CCTATAAAAT 


78301 


TTTTCAGCAT 


GATTGCCTCA 


GTAGAAAAAT 


TAAGGGACTT 


ATTGATATAT 


78351 


ATGTATATGX AGGTGAGGAT ACACATATAC ACACACACAT ATATATGTAG 


78401 


om 7, ft 7 rp 7, p*> 7, rp 
b 1 AAA 1 AL- A 1 


T\ rp ft mm ft ft rpp* 
A 1 A I lALAlb 


T»P , T»ft r Pr , ft ft TV 


LA 1 ALA 1 AL. 1 


LAI 1 1AI i A 1 


78451 


Abb 1111 bAA 


AbL. AAL-bAb 1 


lAlAbl 111b 


rprp/-i/-^/-t a nv~»p-» a 

1 1 bbLA 1 bbA 


f"Pf^ ^ 1 1 If 1 llYVFprp 

1 LAI 111 iAL 


78501 


rp 7v rprppt 7\ P"»rp 71 7, 
1 A 1 1 IA(j 1 AA 


A 1 L, Ab 1 LAA 1 


TV" ft ft O ft O/— >/~Tp 

1 bAAbAbbb 1 


m/™ 1 ft f Hf 1 11 1 irp ft ITV— ■ 

1 bA 1 1 1 1 A l\a 


GTATTAGTTT 


78551 


mfnmn/i ft ft ft f~*rn 

ill bbAAAL. 1 


pmp ft r~»/^rprprrift 

blL-Abbl 1 1 a 


rr»ft Orrtft" 7i ft rprprp 
1 Ab 1 AAA 111 


rpp"> Tip?, rp pi rprp 
lb ALA 1 L 1 I A 


/-< 7, x pmrppp ft O 

CAACTTCCAC 


78601 


TGAGATTTTT 


TTG C TTG AC T 


ft ft rnrrripppinrH 
AAlblbbbl 1 


p> 7i nV>P""P' ft ft rp ^ 

bAl bLLAAJ. A 


ft P 1 rp ft m» rpm ft ft 

AG TAT ATT AA 


78651 


LbuAAA 1 bbA 


P"»rp ft 7, j\ jppj 7. 


ft TVTV"* ft pfPTP 

A lb 1 b Ab lib 


ft ft T^T* 

AAbLALAA 1 1 


TTGTAAATTT 


78701 


1L1 1 Au ibiL 


fpp ft prp ft ft rp ft P" 
1 Lnb 1 AA L aL 


rprpft ft rp 7, pmr pi 
1 LAAlALlnb 


rpp^r-« is rprprprp ft pi 
lbLAl 1 1 lAb 


P^LPP A ft ft ft rp 
b x AbbAArtA 1 


78751 


111 I 1 lb 


rprrirprp ft rr irpi mi i 1 ft 
1111 A 111 1A 


ft ft rp ft ft PTi ft rp ft 
AA1AAL 1 Al A 


ft ft r nr ,ir r* r n ft t> a. r* 
AA 1 b 1 1 A 1 Ab 


1 1 bL» 1 1 b 1 A 1 


78801 


ftftftftfftftftfft 


bnlALV-1 1 1A 


ft P ft fpp ft rprp ft ft 
ALA 1 bA 1 1 AA 


ft. rp ft rpp * * j\ rpp 
A 1 Al b AAA 1 b 


L-1A1 1L.1L-1 1 


78851 


PA a i ft r Pft r Pr ,r P 


1 riftL 1 AAAbA 


AbUAC I bLL 1 


or*" m/-' rprp ft O ft ft ' 
bLILl iAbAA 


P'T'rp ft tppr ft p> 

b 1 1 AAbLAAb 


78901 


r;pp a rp a rp A T 

VjV_\_A iriLU/t 1 


AloL 1 VjV—Vj 1 A 


f ft fpr; ri r* r p r p r p r p 

LAI Tj^jL. 1111 


a. apip a a.TP.fs 

AAL~ AL. 1 L>\J 


ft rp ft rprp ft r** ft ft ft 
A1A1 lAbAAA 


78951 






PTPPAPTATT 
V— X LLnL X A 1 1 


111 LnuL 1 A 1 


r^Trs pp a tczt 

\j 1 VjnULn I u 1 


79001 


GAAAGTTACA 


TTT AG TAATT 


AAACTCATTT 


CAGTAGTTTG 

wnw x xxx \J 




79051 


AAAATTAGG T 


ACTCCGGGGG 


CATATCAAGC 


AT ATTG T AAA 


\_ X TTVJ X X X O 


79101 


ATT ^ TTATTT 

-t* X X * *- X X -T* XXX 


X X X*. X X W W X *i 


TTACTATTAC 

X X X *ii X X **v 


TATTCTATAA 

x + *. x x w x x nn 


TAAGTCATGC5 


79151 


GCAGGCAGTA 


GGGGTACATT 


GGAAGAATTG 


CACTGTCTTA 


AATATGTCCT 


79201 


CTGTTTAACT 


CACAAACTCA 


GTCTACCTAG 


GCTTTCTTTG 


GAGGATCTGC 


79251 


CTTTCATTGG 


CTGTTTGACT 


TTGGCCAAGT 


TACTTAACTT 


CTTTTCACTT 


79301 


CAGTTTCCTC 


ATCTGTGAGA 


TTATGTGCTT 


ACATGACTTC 


AGGTTTTGTT 


79351 


TTGGCTCTAA 


TATGGTATGA 


TTCTATGAAA 


TGGAAAGTTA 


ATACATTTGG 


79401 


CTCTAGTAAC 


TGTATTTGAA 


GCACAAATAT 


TAAAAAGCAC 


AA T'T'AA r P r '^PJT 


79451 


CATTCTGAGT 


TTC C ATTTAC 


TCTTTTAAAT 


TAATCATTCA 


GAATAAATCA 


79501 


TTTTGGAAGA 


GCTGCTTGAT 


CCAGGTATTC 


AGTAGAAATC 


ACTAGCATAG 


7S551 


CATTTAATTT 


TAGACAAAAC 


TGAGAACTCA 


TTAAACTGCC 


AGGGCTATGG 


-79601 


ACTTATATGA 


GATTCTCATT 


AAATCTTAAT 


G TAG AT AA C T 


C AG TTAATTA 


79651 


AAAC AAA TAT . 


GGTTGTACTT 


TATTAAACTT 


CTAAAGTCAA 


AACTGCATTG 


79701 


AAATTATCTG 


TACAAAGCCT 


TGTTGACCTT 


TATTAGAGAA 


CTGCCTCTCA 


79751 


AAAGACCTAA 


AAGACTTATT 


TGTTCAGATC 


GAGACTCTTC 


ATGAGCCAAT 


79801 


GTGATACTCT 


CCCTCTATTG 


CTAGATCTTC 


GCATCAGAAG 


ACAGCATTCC 



Fig. 2 (Forts. 44) 
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7 9851 TCTGAAAGTG TTTCTAGTAT CAACAGTGCC ACAAGCCATT CCAGTATTGG 

7 9901 CAGTGGTAAT GATGCCGACT CCAAGAAGAA GAAAAAGAAA AACTGGGTAA 
799 51 GTTACCATCC TTCATCTAAT TCAGAAGCTT ATTAATGCAT AATGTGTTAG 

8 0001 GCCTTTTTCT TTGGGGCTTT AGTGATCTGC AGTAGTTTAC AAAGGGTCCC 
80051 ATTCAAGCTA CTGAGACCTC AAATGCTGCA CTCATCACCA AAATTGG AG T 
80101 GGCATGTACT GAAAAGCATA CATTTTAATG TTGGGACTAA ACTTGGGTTT 
8 0151 GAAJ'CACCAC TATATCTAGA CCTTTTGAGG GGCCTGAATT TTCTAACCAA 
8 0201 TAAAAAGACA GTTAATAGCA ACTATATTTA TTTGTGAATA TCATTTATTC 
8 0251 ACAGATGTTA TCTAATTTTT CTATAGTATA ACTATACAAA CTATGTAGTA 
8 0301 TAACTATAGA GTTATACTAA AGAAAAATAA GATAACATCT GTGAATAAAT 
8 0351 GGCTTAAAAT AGGGGTTTAT TGTGGGCATA GAGATGAAGG AAAAGTGAAA 
804 01 AAATGATGAT GATGGTGATG ATGATGGTGA TAGTGGTCTT GGAGGAAAAG 

' 804 51 GAGAATGGGA GTTAATAAAG GGAAAGAATA AACAATGAAA CTCTCA.TTCC 

8 0501 ACCTTTGGAA TCGACAGGGC TTACCGTGTG AATAGTTTCA CCCTAAAAGA 

8 0551 AATCAAC C AC ATT AG TG TC T GCTTGATGTT TTTAACCAAG AGAATATAGC 

8 06 01 AGAAATATAG AAATGCACTT TAACAGAACT GTACCTTAAG TTTGCTAGTG 

8 0651 ATATAATTTA TGATATTGAT CAATAGCTAA ATAGCCCAGG GGAAGATACT 

8 0701 GTTACTGCGA AAAATTTAAA AACAATGGAG TCAATGATTT CTTTTAATAC 

8 0751 CAAAAAAAAA ATGTAGATTT TG AG TAAATA CAACTCTTGA TGAAATCCAG 

80801 ACATAATTAT CAGAGGATTT TACTGGAGTG CTTTCTACAA ATAATGAAAG 

80851 AAATATCTTT TTATCTTAAA AAATGTTTAT ACAGGTAATA TTTTAAAAT A 

8 0901 CTGATCAGCC TTCATTCCCT TGATTTGTAA TTCCACACTC TTTCATGTTT 

8 09 51 CTGCAAGGTG AACTCTAGAG GAAGTGAGGT GAAXATAAAC CGTGGACAAT 

81001 TTGGCATGGA TXTATAAAAA AACCCTACCT . TGGCATGAAT GCTATCCATT 

81051 TTGGCAGTAG GCTTTTATAC CTTTTAAAAC AGATTACCTT GTATGTCTTT 

81101 TCTTTGTGTC TTTTCATTTT AATCTCAAAT TTTAAAGAGA TGTAAAACCA 

8.1151 CTTTCTGAAT AGAGCTGTAG GGGATACCAA TTCTGGTTTT GAGTAGTCTG 

812 01 GGGTTGGAAA ATTTGAATAG AAAAATCACA ATTAATGAAG TGTTAGGTGA 

812 51 ATTTGATTTC ATTTTGCTTT TTAAGTTTGT ACTGTCAGCA GGACATGACT 
8 1-3 01 TGATTGTAGC GCTAAAGTGG CCATTTAAAA CAAATTGCCT TGAAGAGAGA 

813 51 -AGCATTGGGA ATGGAGATC 



Fig. 2 (Forts. 45) 
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Humane genomische Sequenz 



1 


;!gaattcctgg 


TGGAGAACAG 


/CACATGTACA 


GATGGGGTGA 


GAACAGCATA 


51 


CGTACAGGTA 


GGGGTAAGCT 


GGTGCTATAT 


GAGAAAGCAT 


GGAATAAGTT 


101 


ATTAAGTTTG 


ACCTGCTTGG 


GAACTGAGGG 


GCAGGTGTGA 


GGGATGAAGC 


151 


AGGAGTAGGT 


AGGGGCTAGA 


TCACAAAAGA 


TCTATGCCAG 


TGTTTCTCAC 


201 


AGTGTGATTC 


CCAGCCCAGT 


AGCATGATAT 


CACTTGGGAT 


CTTGTTAGAA 


251 


ATACAAATTC 


TTATACATCA 


CCCTGGACTA 


GACCACCTGA 


ATAAGAAAAG 


3 01. 


TTGGGCATGA 


GGCCTACAAA 


TTTTTAAAAA 


AG TC AT AC AG 


GTGATTGCAA 


351 


TGCATGCTAA 


AGTTTGAGAA 


ACACTCTTTG 


C TG TG G TTTG 


AATATTTGTG 


401 


TCCTTCCAAA 


ATTCATGTAG 


AAACCATCTC 


CAATGTTATA 


GTATTAAGAG 


451 


GAGGGACCCT 


TGGGAGCTGA 


TCAGATCATG 


AAGTCTCCTT 


TCTTATAAAG 


501 


GGGATTAAAA 


GCCTTGGCCC 


TTTTACCCTT 


TGTCCATGTA 


AGGACACAGT 


551 


GTTGGAAGCA 


GGGACTGGGT 


TCTCACCAGA 


AACAGAACCT 


GCCAGCCTCT 


601 


TGGTCTTGGA 


CTTCTCAGCC 


TCCACAATTG 


TGAGAAATAA 


GTTTCTGTTG 


651 


TTTATAAGTT 


AACCAGTCTC 


AGGTATTTTG 


TAATGGCAGC 


ACAAAGGGGC 


701 


TAAGAAACTG 


TTCTATGCCC 


TAA C AAG AAA 


TGTGGTCACT 


TTCCTGAAGG 


751 


AAATGGGGAT 


ATATATAAAG 


ATGTTATATA 


AG AC T C G TAA 


TATTTATTTG 


801 


GAAGGCTTGC 


TCTGCAAGCA 


AGGTGGAAGA 


GCAACATGAA 


GGAAGCGTGG 


8 51 


TGGAGGTGAG 


AGGACTGGAG 


GTTAAGTTGG 


TAGGGAGATA 


CAGGAAAGAA 


901 


GCTTATGACA 


CtTGAGTTAA 


AATGTAGCAT 


CCTTCCTATG 


TGTAGGGCTC 


951 


AT AAAAATG T 


ATAGTCTAAG 


ATAGAACACA 


GAATACTCTA 


TGAATCCTGC 


1001 


CCACAAGGTG 


TTGGTAATCT 


AGATTCACTT 


TTTTTTTC TG 


ATAATGCCAT 


1051 


CCATATGTAT 


GGAGCGTCTA 


CTACTGTATG 


CCAGAGTGAC 


TCTGGAATCG 


1101 


GTTTGGTTGA 


TCTAGACAAG 


AC C AT AAGG A 


GAGTCCCCTT 


ACTACCTCTT 


1151 


CTCCAGGGGA 


GGGATTCAAG 


TTGAACTAGT 


ACTTCAGAGA 


C TG T T TAG T A 


1201 


ATATCATGCA 


TGAAAGGTGA 


TGGTTAGGAC 


AG AAAAA TAA 


ATGGATTGCA- 


1251 


TCATAATTCC 


TCAGGTTCTC 


CAAATATGTG 


GTGGTCTCAA 


ACCATGTGAA 


1301 


TTGGTCTGCA 


CATCCTGTTT 


GGGTTGCGTG 


TCAGCAGTTG 


AGATCTGAGC 


1351 


CTTATTTGTA 


ACAGTGAAAC 


AG TG AG AG AC 


CTG'CCCTTCA 


AGAGCTGTTT 


1401 


TTCAGCTAGG 


AATAGAAAAG 


GGCCAGGCTA 


GACTC^^C^^ 1 


TCTGCTGGAT 


1451 


CTTGCTTCTT 


CTCAGCAATA 


G AAG TAG AC C 


TGCCTTCCTA 


GCTGTAGAGA 


1501 


AAAGGTGCCG 


GTAGGCGGGC 


AGGTGAGCCT 


GTGGATAATC 


CTGGAGTAAA 


1551 


GGTTCAATAG 


ACCTTCAAGT 


CTATCCTACA 


GGATTCGGAG 


TGAGGGGAGA 


1601 


GAAAAGGAGA 


CGCTTCTCTG 


G C TG AG AG AG 


GAAGAGAAAA 


AAAAATCCCA 


1651 


GATATCTGAC 


AGCTATATCT 


TCCCATCACC 


ACCTTCCTCT 


AAACCCATGC 


1701 


CTCTCTGTTT 


AGTAGGACAT 


AAAATGAAGA 


GTGACCCACC 


CCCCACCCCC 



Fig. 3 
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1751 


AGCCCATCCC 


CCGTTTGTAG 


GTGTGCTTTC 


AATGAAAATA 


AGTCGGTGTT 


1801 


CATGGACGGA 


AACTAGAGCA 


GCTGAAAATA 


GATGCAAGAC 


TTGTTGAGCA 


1851 


TACAAATCAT 


TTCCCCCTTA 


GTCTCCAAGG 


GAGGAAAAAA 


AATCCCTCTT 


1901 


ACTCTCCTTG 


CAGCCTGTGT 


TCTGCATTCT 


GGAGAGGAAG 


CTGAGGCTGG 


1951 


TCCTCAGGCG 


CTCCTCCCGC 


CGTTCCCGCA 


GG AAACTTTT 


CTCGCAGGGC 


2001 


CCGCTCCGTQ 


CATCCCGCGC 


GGTTCCAAGA 


CGGTGGGCCT 


CCCGTGGGCT 


2051 


CCFCTCCTGG 


GCAAGGGCCC 


AGACCCCGCG 


ACGCGCCTGT 


CTCTTTAAAT 


2101 


TCCAGCTGCG 


CGGCTGGGAA 


ACAGCGCCAC 


TCGCCGCCCA 


GGCCGGCTGG 


2151 


AGGCTGAAGA 


GCGAGCTCGC 


GCTTTCGCTC 


CCGGCTGCGC 


GCCGCGGAGA 


2201 


GCTGGGCTCG 


GCCCGCGGGC 


TGCTAGGTGG 


CGGCGGCGCG 


GGGCGGGGAG 


2251 


GCGCGGCCCG 


GCGGAGGAGG 


GAAGAAAGAG 


CGAGCCGGGC 


CGGGAGAGGC 


2301 


GCCGCGCCCG 


GTCCCGCGCC 


. CGGTCCCGCA 


CCCGCTCTCA 


GCGGCCCAAG 


2351 


CAGTTTCTTT 


CTGGGTGACA 


AGAATGTGCC 


TCGGTTGGTT 


TTTCTT'TTT'T 


2401 


TTCTCCATCT 


CCTTAAGACG 


ATTTCCATAG 


TAACCTGATC 


AAGTGGCTCA 


2451 


AAATCGCAAA 


CCTGAGGATT 


TCCGCGGCCC 


GCCGGCAAGA 


CCTCGGCCAG 


2501 


GTAACGCTGC 


GATCTCCTCC 


TCTTCCATTG 


CAAACCGCTG 


CGCTCCTTGC 


2551 


AAAGTTCCTT 


TTGTGGAAAA 


TCGCCCAGCC 


CAAGGGAGCC 


CGGGGTATTT 


2601 


GCAACAGCGT 


GTTCATTTCC 


AGGTGCCTGT 


CACGGGTCTC 


CTCCCTGCTG 


2551 


CTTCTCCAGG 


AC CCATGATG 


AGATTATTTT 


TAAAAATTGT 


TTTTGGTCGT 


2701 


CTCCCCCGCC 


CCCTCCCCTT 


CTTTATTTTT 


TTCCTCTTCG 


CTGCACTCTT 


2751 


CTCGGCTTTT 


CCCCTGACAC. 


TACTGATGGG 


GGTGCGGGGG 


GACGTCGGGG 


2801 


ATGGGGGTGG 


CCAGCGCGGT 


CCTGGGAGTG 


GCGGGTTCGG 


ATGGGCTGGC 


2851 


TGCGGTGGGC 


CACTTTGGGC 


ATCTCGGCGT 


GGCCTGCGCC. 


GGGGTCACGG 


2901 


GGAGGGCTGT 


CAGCGCCAGG 


GCGGCGGAAC 


CCGAGGTCTC 


CAGACGAGTG 


2951 


AGGGAGGGAT 


GCAGGCTTGG 


GGGTGATGGA 


GCGCTTGGCT 


GGTGGCTGGT 


3 001 


GAGCGTCCAT 


ACATCATAGC 


TCTCCTTCCC 


ACTCCCCCGC 


CCCTCTTCGG 


3051 


GATTCTCTCT 


TTCTCTTTCC 


CCGTCCTCAT 


TTCTTTCTTC 


CTTTACTCAC 


3101 


CACTCGCTTC 


ATTCTCTTCC 


TTCCATTTCC 




TCCCCTCATT 


3151 


^ ^ *J* T"J* 'J"J* T* T"- 




TTAAAGAAAG 


GGGAATCGTT 


TGTAACCCTT 


3201 


TCGTTCTACC 


AACGTGGAAT 


AGCTGTGAAA 


CCTGCAGCGT 


GGTCACCTCA 


3251 


GCCTGGTCGT 


TTTCAGACCC 


GTCCTCATCC 


ATCAACATAT 


TTGTTTCCCG 


3301 


AGTCTATTGA 


TCTCCCTGAA 


TTCTACAGAA 


ATGCATTCTA 


AGCTAGGCGC 


3351 


CTGTATGTCA 


3AATCAGTTC 


TGCAGGTAGC 


TTCCGTGCTC 


CAAGTATGAC 


3401 


ATGTATTGTA 


AGGGCTGCAT 


CTG TTTTAAA 


CCCACATAAG 


CCATGGGTAT 


3451 


AAATAAATGT 


AGCTTTGAAA 


AAAAATCTGG 


CCTTATTCTA 


GATAAACTTC 








Fig. 3 


(Forts. 1) 






21* 



3 501 CCTCTTAAAT TACTGATATA 

3 551 GAAAGTTGGG AGACAGGTTC 

3 601 TTCTATTATC TTAATTTTCT 

3 651 CCCAGTCAGT GGAACGAGTG 
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CTCTTCTCCC TCTTTGACAT TTAATTTTAG 
TTGTCCTCCA GTTTTTAAGG AGCAGGCAAC 
CGTCTTTGAA CATCAGTCAC GTTTGCACTA 
GGTCATAATT AA 



Fig. 3 (Forts. 2) 
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Humane genomische Sequenz 

1 ;CCTGCATTAT TGTTTTTATC /tGACTTCCAA TTTTGGTGTT CCCTGGGTGG 
51 GTGGGTTTTC CTGACACATT TACAAGATGC TTTTGGCAGG TTGGCTGGAA 
101 TTTGAAGGCA CATTTAATTG TAGGTGCAAT AAAATATTCA TTTTCTCTTG 

151 TTCTTGGTTT GAGATGTCAT GCCCTTTTGG TCACTTATAT TTTGGTGTGA 

201 CTGTGTGTGT GTGTGTATGT GTTTGTGTGA AGGATTTAAC AAAGTCTGTT 

251 CTAACTGTCA TGTGATTTGA AGTTAAAAGG TATGTTAGTG ACAAGCCACA 

3 01 AATTTCTCTT ATTTATAGTA CATTGATCCT GAAACCATTT TTTCCCTTGT 

3 51 GATTTCTTCT GTGCATGGAT CATTTAACGA AAGGTTGGCA ATGATGAGCT 

4 01 ATTTTTTTAT AATAGGAAAA AAATTCCTCA AG TTT ACTTA CCAAGTCATA 

4 51 TTTTTATACA GAGGGATTAG CAAATATTTC TGATCTAATA TTTTAATAGA 
501 CTGAATT.GCT GACCACTGCT AATTACCAAG AATATATTTT CTTAATTCTG 

5 51 AAATTGCTGT ACCTCTCAAG TTGTCTGGAG GACTCCAAGT GACCCAACTT 

6 01 GTAACTCATG GCAACAGGAA GTGGTTGTTC TGGGTGCAAG CTGAAGTGTG 
651 CACATGGACC CGTACTTTGT TAGCACTCGG GGACTTGATA TGGAAAGAAT 

7 01 TAATGTACTG GCTTTTTTGT ATAGATGAAT GTTAACTTTC TGACATTAGT 

7 51 CAGAACTACA TCTCCCAAGC CTTGTTTTGC AGTGTCTGTC CCTTTGCTCT 

8 01 TCACTTACAG TAAGTCCTTA CTTAACTGAC TTGATAGGTT CTTGGAAACT 

8 51 GCAACTTTAA GCAAAAGGAA GTATAATGAA ACACTTTTAT CACAGGCTAA 

9 01 TTGG TAG AAA CAAGACTTAA GTTCCCATGG CATATTTCTG GTCACAAAAA 
9 51 C ATTTC C AAA CTTCTCAAAA CACTTCAATA TTAAGCATTC AAATACATGT 

1001 AAACTATGTA TATATGTAAG AAAGGTTACT ATAAACCAGA TCAATATTTA 

10 51 CCCAATTATT TAAGTTCAGG GTCTTAGGTG GCTGGAGCCT ATCCGAGTAG 

1101 CTCAGGGCAC AAGGCGGGAA CCAGCCCTAG ACAGGACACC ATCCTGTTGC 

1151 AGGGCACGTT CACACATGCC CACACGCAGG CTGGGACCAT TTACATGTGC 

12 01 CAATTCACCT AC C ATGC AC A TCTTTGAGAC GTGGCAGGAA GCAAGAGTAC 

12 51 CTGGAGAAAA TCCATACAGA TATGGGGAGA ATGTACAAAC TCCACCCAGA 

13 01 CAGTGGACCC AGCCAGGAAT CAACATTTGG GCAACATTAT AATGAAACGA 

13 51 AGTTGAATGA AATGATGTCG TTCCACGACC TGCTGTACTT GAGGGGTGTT 

14 01 ATAAAATTCT CAGAAGACAG AGGTTTAATG CTATCTTTTT AATAGAAAAT 
1451 AACTTATAGA GAAGTGTGCA CATGTGACTT TGTGTGTAGC AGGAATCATT 

15 01 AGGATGAGAA TCAGACGTAA GAGGTGGTGC CAACATGAGG AATG TTG AG A 

15 51 TTCAGGGAGC TGTGGATGGA AGTAGAAGCC AGAAGGCCAG GGTTAGGTTC 

16 01 CTACTTCTTA CTGTTTCAGT TATTGCAGTG TTGGCCTGTT TATTCACAGA 

16 51 TGTCACCTAG CTTTGTTTTC TCAAGAAGAA AAATGAGCAT AATCTTTCCT 

17 01 GTTATGAATT CTTAAACACA CAGGACATAA CCACAGACAC AGAGGTGCAC 

Fig. 4 
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17 51 ATATGTAGCA GTAATGGATA C T AAATG AT A CACTCGGAGG AAACAGAAAA 

1801 GACTTCTGAA TAGAGACTGG AGATACTTCC TTGGACCATT GATGAATGGG 

1-851 CAATGATGCA TTTTTG TCTT CCATTCAGAA GGCTAATATA TTGCTCTCTA 

1901 TGTTCTATGG ATAAAGGCAG TATATGCTCA AGGATGAATC ACATAATATG 

19 51 CATAATAAAT CCAGCAAGCA TTACCCTTTT AC TTATGTG A CTGCAAGTAG 

2 001 GAATACATTT CCCCCACTCT AACCATGTAA GATTTCTTTC CCTTCTCCCA 

2 051 TTTTGTAAGC AAAAGTAAGT TCCTGAAAGG TTAAATGGAC CTCAGGATGG 

2101 m . GAAAAATCCC CAGAGCTATC TTTCTGCACA GACTTCATTT TTTCTCCCAA 

2151 GTCTGACTGT CAACTGCGAT ATCTGATATG AGGCTCTGGT GCTGATGTTT 

-22 01 CCATAGGTCA TCATCCTTCG GTGTCCCAGA TGAAGTCTCA GGTCGAACAT 

2251 TGCAATAGCA CAGATTCTGA ATTTAATGCA TCATTAAAGT TGGTTATGTA 

23 01 ACCCAATGGC CTTGTTAAAC TCCAGATTTT TAAAATTATA TGTATTTACT 

23 51 ATTCTCTTAT TTTAGAATGA TCTCACAATG TTCACAAGAA ATAAGCCCAG 

2401 TCCCTGCAAA GACTTTAAAA GCTGCTTGTT CACATCATTA GATTGTACAA 

2451 CGCTTGTACA ATGACACTTT TTGCTAATCT ATGCAACATT TTTGTAACAA 

2 501 TTGTGCACAT TTTAACTACT TCAGATAATC AGGACCTAGA GACTTCAAGA 

2 551 TCTGGAAGCA TTGCTGGTGA CATAGAGCAA AAACTTTCTT GAGAATAGGA 

2 6 01 AGTCAGTGTT TTGACAAGTG ATTTATAACA GTTCAGGTAT AGCCAGGAAG 

2 651 GTTTGAAACA AACCTTAAGT ATTATTTCTT TCATCTTGAT TAGTATATAT 

2701 TTATATGTGA TCTATTTATG TATATTAATA GATTTTTGGG TCTTATAGCC 

2751 AGCTTTCATT TTTCTCTATT GGAAAAGATC TAAGTCCCCA TCCTTCCTTG 

2 801 GTGGCTTTTG GTAGGTTTGT" AGACAAAACA TTGAAGAATC AATGGT AC CT 

2851 TTT AT AC ATT AATACTGCCA ATATGACCAT AAAATCATAT TTTTTGGGAA 

2 901 TTTATTCCCC CGATCAAAAG XAGCATTTGT TATTGAACAC AGTCTTATGC 
2951 TACCTTATTA AGATGTATCA AACACCCTGA TTGATCAAAA ACACCTCAGT 

3 001 CCATTTTAAG GCAGTATTGC CCAGCAATTA AAGATGTAGC TTCTGGAGGA 
3 051 GTCTTTCTGA GTTTGAATTC AG T A C TCTTC CACGTACTAT ATAGGTGATC 
3101 TTGGGTAAAC TTCTTGAGTC TCAGTATCCC CATC TGTAAA ATTGTTGTAG 
3151 AGAAGAATTT TTGTGATGAT TAGGTGAGAG AATATATTAA TGTAATATTT 
3 2 01 AGGAGAGCAA CCAGCATGTA GCATATATTC ATTACATATC AATTTCTATA 
3251 TTATTGATGT TCATACTGCT GATGTTGAAA TGCACAGGAA GGCCACAGTT 
3 3 01 ATTTTCTGTT TAGATTGATT TTTCTTTTAA AGTCTGAACA TAAACTGTAA 
33 51 TACTGTGCTT ATTTATGTAG GAACTGTGAT CTCGTCTCCT CCTTTTCCCA 
3 401 TCTCCCCCTC TCTACCTTAG TTTTTCCTTA TAGTCTCAAG * CTGAAAACAA 
3 451 TGACCAGGTG CCTAAGAGAT" AAGAATACTC TTTCTTTTGA ACTCATGGCA 

Fig. 4 (Forts. 1) 
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3501 TTAGCAGTGA CCTGGATGAG ATTGGAGGCT ATTATTCTAA GTGAAATAGC 



3 601 AAGCTATGAG GATACAAAGG CATAAGAATG ACACAACAGA CTTTGGAGAC 

3651 TTGGGGAAAG GGTGGGAAGG GGGTGAGGGA TAAAAGACTA CAAATAGGGT 

37 01 GC AG TGTATA CTGCTTGGGT GGTGGGTGCA CCAAAATCTC ACAAATCACC 

37 51 ACCAAAGAAC TTACTCATGT AACCAAACAC CACCTGTTCC CCAGTAACCT 

3 801 ATGGATATAA AAAAATTAAA AAAAAGAAAA AAAGAAAACT CTTTTTTGCA 

3851 GGGGGCAGGT AA£GGGTA^G AGGGCATCCC ATTTTTGAGT TTCTAGAAAA . 
3901 " GCTT 



3551 



TCAGGAATGG AAAACCAAGC ATTGTATGTT CTTACTTATA AGTGGGAGCT 



Fig. 4 (Forts. 2) 
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Humane genomische Sequenz 

1 fCTGCAGGAAG CAGCAGCAAG / GTCC AGGG AG CCTCTAATTT AAATAGGAGA 

51 AGTCAGAGCT TTAACAGCAT TGACAAAAAC AAGCCTCCAA ATTATGCAAA 

101 TGGAAACGAA AAAGGTAAGT GTTTGTTACA TCATTATGAC ACAAGTCCAA 

151 CATGAGTCTT GTGAATTGCA TGCTAAATCT AATATTTGAG CAGCGTAACA 

2 01 ACTTTGGGCC TAGAGATGTT ATC AG TGG AG TTTCTTTATG TTTC CTAACT 
251 GTCCCCTCQT GACTGCCAGC TTTCTTATCT GAAGAACATT TTAAACAAAT 

3 01 AAACTCATTC ATTTTAAAGT AGTTAGTTAT ATATGCAAGT ACAAATACTG 
3 51 TTTCTCAAAA ACAGGTCCTT CCAAATGCAT GTAAATCACA TTTTCTTATG 
401 TCTTTTTATG TTTTTGAAAA TGTATCCTGA AATCATAAAG CCATATTGAA 
451 TTTATCTGAA TCCTTAACTT CAGTTAAGGT AAGAGCCATA AGTGTTTTTG 
501 ACAATTAAGG T TGG AG CATC AAAATTTGAA ACATAATTAC AGTAGG TTTT 
551 TATCTTTGCA AGCAGCAGAT CCCAGAGATA TTATGACCTC AGTTTTCCCC 
601 AAAAGACAAA TTATTCATAT TTGTTTTGTT TTCTTGAATT AGTGCATAAT 
651 ATAAATATCA AATCACAAAA TCAAGGACAT TAAATGAAAG TGTCTGTTAA 
7 01 AGGCATATTA TAAATGAATC ATAAGCCACA CAGTTCTCTG TGATGTACGA 
751 AGTGGGCATT TAAAGAGGTG CTGATTTGAT GCTTGTCACT GAGTAGCAGA 
801 GAGGACGGGG ATGAGTATGT G TAGTTTAC A CCTCAATCAT GAGGAAGTGA 
851 AGAACTTGTG CTGTTATAAG TAGTATGGCT GTGTGAGGAA CTAGGGTGTT 
9 01 CTGCTGGATT T.TGAGGAAGT ATTTTCAAAT CAATAGAACT TCAAACTTTT 
951 CTTCAGAGTG TTGGGCTCTA CATGGAAAAA CACATGAAAT TAAAAAGTGG 

1001 CACAAATGTT T AGTTAG TAG AACATCTGGC TAATTGGGAT CAAATAATTC 

1051 AACCATGTGG GAACGTTTTT GCTCAAAATA GATAATTGTG AATTGTTTCA 

1101 TATAGGCAAA TGATTAGACA ACTTCCTCTT CCTCAAATGT GAACGGACAG 

1151 ATGTGATCTA GAAGCAAGAC ACTCTTTTGT GTAAATATTC CCTTTGGCCT 

12 01 AAAGCAAAAG TGGACAGACT TTAAACACCT GAG AG C AGAG CAGTGTGTGT 

12 51 TAAGATTGCA ATATCTTAAG CTCTTGAGTT AAATGGAAAA TGAAAAACAA 

13 01 AAGTGTATAT TTGGAAGTTA GGAATGTTTT CTTTAAAATA TAAAATAAAA 

13 51 TTTTAGATTT AAGATCACAA GAAATATTAC TGAAGACTTA TACTCTTCCT 

14 01 GGGGCTAAGG GAGGTGACAG TCGCTCATCA GAAAAAAAAA AATGCCCTCA 
14 51 TTTCCTAACT TTTCTAAAAA ATATAATACA AGTTCAGGCT AATACTTCCT 
1501 GTATATGTGG GAAATTTCTA GGGGAAGCTA ACAGGCTTAG AAATAAAGAT 
1551 GTGTTAAATA G AC T ACC AAA GTGTCCAATT AAGCAACACG ATACCACCGT 

16 01 TATTGATATT CTAGCAAGAA ATTACTAGCA ATGTTTGTAA ATAGACTTAG 
1651 AAATGCATTT GATGAATTAA CACTTTTATA TCTTAATTTA TCTGAATTTT 

17 01 TCTGTAATGT GAAAATGTTT TATTTAACTT ATTTCTGGCA TCTATTAGTA 

Fig. 5 
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1751 


AAATTCTGAT 


GATATACAAG 


CATTAATATT 


TTTCCATGGC 


CACTCAATTC 


1801 


ATACATACCT 


TCCCTATCTA 


TGCTTAGAAG 


GCAGTGCAAA 


ATTAGATAGT 


1851 


AG C AATATTG 


ATTATAACCA 


CAAGGTGGAG 


ACAGATGTCA 


TGTAATATGC 


1901 


AGTCTGCTCA 


TATAAAGCAC 


ATTTTCTTAG 


ACAAGAGTTT 


TC AT AC GAT A 


1951 


TAATAAAGAC 


ATCTGGAATT 


TGTCTTGTAT 


GCAATATGAA 


ATTTGCTATT 


2001 


AAACGTGGAq 


TTAAAACTTT 


ATGTCAATAG 


ATCCAATAAC 


AATGTTCATA 


2051 


AA'PTAATCAT 


TATGTCATGC 


TGTATTTCCA 


AAATACTATC 


TTAAATTATA 


2101 


AGAGCAAACG 


AGGTAATAA 














Fig. 5 


(Forts . ) 
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Humane genomische Seguenz 

1 j-GTACATTTTT TAATAAAGAT yGTTTGTTTTA ACTTTTTGAA TATGAAGATT 

51 TCTAGTTCTA GAATAATGTT TATAAAAATA TACAAATCCA TCTGGTGATG 

101 AGTTGACCTC TATCACAACT AGTTTGCATA TATAACTTGG GTGTGACCAA 

151 GCAAGGTpAG AGTTAAGAAC TTTTAAAACT TACTGTATTA TATTGATAGA 

2 01 ACTCAGAAAG TACTAACTTG AATATTATTA TTCTAATTGC TTTTCCCTTT 

2 51 TAGTTATTAA AAATAAGAAT ACTTAAATTA ATAACAAGAT CTTTTACTGG 

3 01 CAGGATTAAC CAAATTATCT GTAATGTGTT CCTCGAATGC TTTTAAGTGG 
3 51 AAATATACTT TATACATTCT TTAACAACTC TGAGAGGATG AGTTACATAA 
401 ATCAGTTCAG GAATCTATAG AATCTGTAAT ACATAGTAAA GGTTTATTCA 
451 CAATTAAAAC AATTTCACTT CTATATTAAA AAAACAAATT GTTGAAAGTA 
501 CAGTGGCTTT TCATATGTAT GATTTGTAAA ACAAATTAGC TTTTTTAAAG 
5 51 TGATGTGACG CTTAATGAGA AGAAATC AG T AGAGAATTAC AAACTGCACT 

'601 TCAAAAGATA CATCTAATAT CATTTTAATA ATGAAATTTG AAAAAATAGT 

651 GTGCTCGTTT TACAGTCTCA TTAAATGAAT TAAAATATCA GCACACATTG 

- 7 01 TAGTAGG TTA TCATTGGCAG AG AAGGC TG A AATAGAAACG TTACAATGGG 

7 51 ATGCACTGCC ATCTGAACAT TATGTCGAAG TGGAACGCGG AAACATATTT 

801 CTCAGAACAA GTGGTAAAAT GAAAACAGCA TCATTTGTAA AGCATTTCTT 

851 TTGAGAGTGC TTCAGTTTCT TCTCCTGATG ACCTGCCATT CAGAAACTGA 

9 01 CAATGAATAA TACACTCTGA CACCAGCATT TGTCAATTTG CCCAGAACCA 

951 TATGAGAGTA CTCTAGACAG ATATATGTTC CGAAG TAAAG CGAATACCTG 

1001 TTAACTGTAA ATCAAATCTT GTAGAAACCA TGCCATGGTT CCTTTGGACA 

1051 TATACTTTGC ATGCCTGAAG CAAGTTACCT TAAGAAATCA TTCTTTTGTT 

1101 TTACAAAACT TGTATTAAAA AATTAAAAAT GCAAAAAAGC TTAATATTAT 

1151 TAGGAATTTA TCCATAGCTT TATTTGGAAT CCAGTTTCTT TATTATGATC 

12 01 TATAAACATG CATCATTTGA TGGAGTTCCT TAGTGG AG AG GTGTTTTTCC 

12 51 ATGTTGCTAA GAAACATGCC CCAGCACCAG AAGGGATACT ACCTACCATC 

13 01 TTTTTGCCAT TTCTCACCGT GATTCTTACA TTGTACCTGT TTACTCACTG 

13 51 AACAGGGCTT CCTTCTCTTT GTCTAGATTC TAATCAGGTG TCTTCTGGTG 

14 01 TGGAAGCTTT GGCTTTTATT TACACACAAC ACAGAATTAA TAAGATAGAT 

14 51 GCCAAGGATT TAGCAACATT TTAATTCAAC ATTATACAGG TATCAGAGT? 

15 01 AATGAGAATT ATGCATTAGT CTTTAAATTT GGGCAGCTTA TTCAGCTAAA 
1551 ACATAGATGT CTAGCTCTTA AACACTTTGT TTTTTTAATT AC TC TG AAA T 
1601 TACAATAAAG TCAAAGAACT GAACTGTTTT CTTTTCAAGC CAGTGCAAAT 
1651 GTGCTTTAGT TATTATTTTA CTGGTGATCT AATTATG CAT TTTAATGCTT 

Fig. 6 
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17 01 




TACTTATATA 


AGC C T AAAAT 


ACG TTGTT AA 

X X ^7 X X 


TG TC AT AATT 


1751 


TPAGGGATTT 


TAGTATTCTT 

x r\w x x x w x x 


TC C ATG AG TT 


ACCATAACTA 


GG TG CAT ATG 


1801 


TGTAAATATA 


CGTATATATC 


TATATCTATA 


TATTTATATC 


TATGTATATA 


1851 


TCAATTTATA 


AGACTAAATA 


GACTTGGCCA 


TATGTGTTGT 


TGGTTTATGC 


1901 


ATACATGC AC - 


AAATATTGAG 


GTGTCCACAA 


AGTATATATG 


CCTGTACATA 


1951 


AATTACA't'AC 


TGGCTGGTGA 


GTGAATGTAA 


GCTTCTCTAA 


ATTGTACAAC 


2001 


TCTCCACAGA 


GTGGCACTCT 


AATATTGCAA 


AGGTACAATA 


TAAGCATG TG 


2051 


CAGAATGAAC 


AGCTCTTCTA 


GGATCCCTAT 


AAAACTCCAC 


CCCATGTTTC 


2101 


TGT 












Fig. 6 (Forts.) 
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Humane genomische Sequenz 



1 


! AAGCTTCATC 


CCAGAGGGGC 


ACTTGCCAGA TGCCTGCTAG AGCTCTCCTG 


51 


"tatgaggagt 


CTATCAACAC 


CTGCTGGGAG 


GTGTCTCCTC GTCAGGAGGC 


101 


ACGGGGGTCA 


GGGACCCACT 


TGAGGAGGCT 


GTCTGTCCCT TAGCGGAGCT 


151 


AGAACACTGT 


GCTCGGAGAT 


CCGCTGCTCT 


CTTCAGAGCT GGCAGGCAAG 


201 


AGTGTTTTAG 


TCTGCTGAGC 


CTGCGCCCAC 


AGCCGCCCCT 


TCCCCCAGGT 


251 


GCTCTGTCCC 


AGGGAGATGA 


GAGTTTTATC 


TGTAAGCCCC 


TGACTGGGGC 


301 


TGCTACCTTT 


CTTTCAGATA 


TGCCCCGCCC 


AGAGAGGAGG 


AATCTAGAGA 


351 


GGCAGTCTGG 


CTACAGCAGC 


TTTGCCAAGC 


TGCAGTGGGC 


TCTGCCCAGT 


401 


CCAAAATTCC 


CAGCGGGTTT 


GTTTACATTG 


TGAGGGGAAA 


AGCACCTACT 


451 


CAAGCCTCAG 


TTATGGCAGT 


TGCCCCTCCC 


CCCACCAAGC 


TCCAGGGTCC 


501 


CAGGTGTCCT 


TCAGACTGCT 


GTGCTGGCAA 


TGAGAATTTC 


AAGCCAGTGG 


551 


ATCTTAGCTT 


GCTGGGCTCC 


ACAGGGGTGG 


GATCCACTGA 


GCTAGACCAC 


601 


TTAGCTCCCT 


GGCTTCAGCC 


CCCTTTCCAG 


GTGAGTGGAT 


GGTTCTGTCT 


651 


CACTGGCATT 


CCAGGTGCTA 


CTGGGGTATG 


AAAAAAAAAA 


CTCCTGCAGC 


701 


TAGCTTGGTG 


TCTGCCCAGT 


TTTG TGCTTG 


AAACTCAGGC 


CCTTGGTGGT 


751 


GTGGACACCC 


AATGGAATCT 


CCTGGTGTGC 


ATGTTGTGAA 


GACTGTGGGA 


801 


AAAGCATAGT 


ATCTGGGCTG 


GATAGCTCCG 


TCCTTCAAGG 


CACAGTCCCT 


8'51 


CATGACTTCC 


CTTGGCTAGG 


GGAGGGAGTT 


CCCCAACCCT 


TTGCACTTCC 


901 


CAGGTGAGGC 


AACACCCCAC 


CCTGCTTCTG 


CTCACCCTCT 


GTGGGCTGCA 


951 


CCCACTGTCT 


AATCAGTCAC 


TGTGAGATGA 


GCCTGGTACC 


TCAGTTGGAA 


1001 


ATGCAGAAAT 


CACCTGCCTT 


CTGTGTTGAT 


CTCACTGGGA 


GCAGCAGACT 


1051 


GGAGCTGTTC 


CTATTCAGCC 


ATCTTTCTCA 


GGTCATAATC 


ATAGATTTTT 


1101 


AATTGATCCC 


AGCAACATGG 


ATTAGTAAAC 


AGCATATTTC 


CAAGTGATTT 


1151 


TTTTTTATTT 


TAAGGTCAAA 


TCTACAAAAT 


ATTATAG TGT 


TATCACCACT 


1201 


TAAAATTATT 


AC TGGTGATA 


CTATGTTTGT 


CTCTATTCAC 


ATTTTATTGC 


1251 


TAGAAAGAAT 


TATAATTTGT 


AGATAATAAT 


AG TT ATTTG A 


AATGTATTAC 


1301 


ATATCCTTTT 


A C TTTTAAG A 


AGAGGTGACT 


TAATTATCTA 


GGTATACAAT 


1351 


TATTTTGAGG 


ATACTAAATG 


TCATGAATAG 


CAAATTTATC 


ATATTGCTTT 


1401 


CCTAGGTGAA 


GACCCTGAAA 


CAAGAAGAAT 


GAGAACAGTT 


AAAAACATAG 


1451 


CAGACTTGAG 


G C AG AATTT A 


GAAGAGACTA 


TGTCCAGTCT 


TCGTGGGACT 


1501 


CAGATAAGCC 


AC AGG TTTTT 


TTCAATTTTG 


CAT AT A TTTG 


AGCCAATAAA 


1551 


GAAAAAATAA 


TTACAAACAA 


ACATTTAACT 


TTTCTTATAA 


TGACAGAGAT 


1601 


GGGATTTCAG 


TTTCCCCTTA 


CTATTTTCTC 


CCTTGTTTTA 


TATCAAATTG 


1651 


ATTGGTAATT 


ATCCTTAAAC 

t 


TGAGAATTCA 


C AG TAT AT A C 


CTATTTATCT 


1701 


TTTATCTCTA 


TCTCTATCTG 


CTATTTATGT 


CTTTTTCAGT 


ATAATTTCCA 



Fig. 7 
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1751 


GTACTGCAAC 


TACCACCATC 


ACTGTTAAGT 


GGATTTGTAA 


TACCTGTCCT 


1801 


AGAAAACAGT 


GGCACAAGTT 


GCACTTGAAA 


TGCATCTGGG 


CAGGGTAGTA 


1851 


GGGAGACATT 


CAAACATAAT 


TGTAGTTAAC 


TTTCAGAATA 


GGTCTGGGAA 


1901 


GGTTACAGTG 


AGTTAAGGAT 


TTGTTGAAAA 


TGTAAAACAA 


TATGTTGTTT 


1951 


TACCCAAGGT 


GTACTGATGG 


CCTTTCTTTT 


GAAAACAAAC 


GAAAAGCTAT 


2001 


AAAATGTATG 


CCCCTTTCCA 


CAATTTGACC 


TCAAAATGAA 


TATAGAGTTT 


2051 


AGC TTTCGGG 


AAGATGACGT 


GTTTATAAGA 


GATGACCCTC 


AACTCCAGCC 


2101 


TTTTCTGTCT 


TCATGCATTC 


TAGATTA.TGG 


CCCTAAGTGA 


ACCAGAGTAT 


2151 


AGTTATTTCT 


CCATTTTATT 


TGACAGCACC 


CTGGAGACAA 


CATTTGACAG 


2201 


CACTGTGACA 


ACAGAAGTTA 


ATGGAAGGAC 


CATACCCAAC 


TTGACAAGTC 


2251 


GACCCACCCC 


CATGACCTGG 


AGGTTGGGCC 


AGGCATGTCC 


GCGACTTCAG 


2301 


GCGGGAGATG 


CTCCCTCCCT 


GGGTGCTGGC 


TATCCTCGCA 


GTGGTACCAG 


2351 


TCGATTCATC 


CACACAGACC 


CCTCGAGGTT 


■ CATGTATACC 


ACGCCTCTCC 


2401 


GTCGAGCTGC 


TGTCTCTAGG 


CTGGGAAACA 


TGTCACAGAT 


TGACATGAGT 


2451 


GAGAAAGCAA 


GCAGTGACCT 


GGACATGTCT 


TCTGAGGTCG 


ATGTGGGTGG 


2501 


ATATATGAGT 


GATGGTGATA 


TCCTTGGGAA 


AAGTCTCAGG 


ACTGATGACA 


2551 


TCAACAGTGG 


GTAAGTAACC 


CTGTTCTCCG 


TCAGCATTGT 


GTGAAGAGGG 


2601 


GAGGTGGTCT 


ACTATAATGC 


ATTCACTATA 


AACAAATGTG 


TAAGTTTGCC 


2651 


CAGAAAGTCA 


TGAGAACATA 


TGAGATATCT 


GAGGTTATTC 


AGAGTGTTGA 


2701 


AGGGCCCTTC 


CTCTGCTCAT 


TCATGGAGAG 


TAAAGAATCC 


AAGATTTCTA 


2751 


TAAATTCATT 


ATAAGCCGCT-- 


AAGTTTTTCT 


GTTGTTGAGA 


GAAACACATG 


2801 


TGGCTTCTGT 


TTTTCAGAGT 


GATTTTCACA 


TGCTTCTTAA 


GTAACAGATT 


2851 


TTGTAGTTAA 


GGACGTGGGA 


AGGAGACAGG 


AGGAGTTTTG 


CTGATTTGCT 


2901 


TGATTTTTTT 




AGCTTGTTAG 


AAGCGGCCTG 


TAACTGCTTT 


2951 


G AG AAAC AAA 


T ATTTTC TT A 


CTGTCTTCAA 


TTATGCATCC 


CCAATTTAAC 


3001 


TTGAGGGAAA 


AATCACTTTG 


GAGTTGAAAG 


TTTCACTCTA 


TTCATTTTCT 


3051 


TTTGATGGTA 


TCAGATTTCA 


ATACATCTCA 


GACCCTGTTT 


TTCTTCTGTG 


3101 


TCCTATTACA 


TTCCAAAACA 


TGTTGTGATT 


GTAAAACTCT 


TAGAGTATAT 


3151 


TAACAATTTG 


GGATATTTGG 


CATAATCAGA 


GAATAGGTCC 


AAAAGGAGGC 


3201 


AATAGGATAT 


TCTATTAATA 


ATTGTAATTG 


CCATTTTTAG 


CATTTCCTGT 


3251 


TATGTACTAT 


GCTCTTGTCA 


AGTGCTTTGA 


AGATAGTGTT 


TTACTTTTCC 


3301 


TTCCCACCAC 


CAGCAATGTT 


TATGAGGTAG 


ATG TTTTT AT 


ACATGTTCTA 


3351 


TGGATAAGGA 


AACTG AG TCT 


AATTGGCCCC 


GGCTGGGAAC 


TAACGCTAGG 


3401 


GAAACGGCAG 


ACCTGCATTA 


GAACTCAGCT 


ATGTCTGACT 


TCAAACACAG 


3451 


GCTCAGTAAT 


ATGTGGAAAA 


GCTTCCCAAT 


TAACTTTGTC 


TATAAACTTT 
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3501 


GTGTGAGTCT 


GGATTTTGAC 


TTACTCTTTG 


TCTTTACGCA 


TCTGACsAGGA 


3551 


CCCATGTAGG 


AAATAATTCT 


TCTATATAAG 


TGACCCTTCC 


TG AC TTC ATT 


3601 


CATGAAAAGC 


TTATGTTTGA 


AGGGTGACAC 


GACCTAAAAA 


AG AG TAC AAA 


3651 


ATAGCTTTTG 


ATTACATTTA 


TAGCTTTGCT 


CTGATATCCT 


AATACCTACT 


3701 


AGTCCATTCC 


TGGTATCCAC 


CCTACCTGAC 


TTTCTAAAAA 


TTTAGAATTA 


3751 


TAGAGACTAA 


TTATGATTAA 


TTAAGATAGG 


TTGTTGTTCA 


GTTGCCACTG 


3801 


GATTCAGAGT 


GCCTAGTTTG 


AATCTCTCCC 


ATTCACTATC 


TGTGGACCCC 


3851 


TTCGGAACCT 


AACGTATCCA 


AATTAGTTTT 


TGTCATCTAG 


AATAAGGATA 


3901 


AAATTGTACC 


ATCTTCATGA 


AGTTGTTAGG 


ATCATCCACA 


AATTTTAGTT 


3951 


TGCGCAATGC 


TTGGCATGAT 


ACAAGCACTC 


AATAAATTTA 


TCATCTTCCT 


4001 


CTTTATCATC 


ACTATTACAT 


TTATTATCAT 


TAATAACCAT 


ACCAATTTTT 


4051 


GGTTGTTGTT 


AGTTATAATT 


ATCATTTTTG 


TATGTATTTA 


ACATAGCCTA 


4101 


GGAGGCAATG 


CCCAGTTCAG 


AAAACATAAT 


GGCAAAGCAA 


GAGTGTCTAA 


4151 


GGCACACTCT 


TTCTCCCATC 


TCTCTCTTCT 


TTCTTCTCCA 


TTCTTTCCAC 


4201 


TCTATCCCCT 


CTTCTCTTTT 


TTTTCTCAAT 


CTCCTTAGAT /G TGG AC AT AT 


4251 


X3TGTGAATTO 
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Humane genomische Seguenz 



1 


\ TGTGGGTGTG 


GGTGTGAAGC 


/ATGTGTATGT GTGTGTGTGA AGCATCTCCC 


51 


CACCTGTAAT 


GTAAGTCCAT 


~ GAGTGCAGAA 


TTTTTGACAT ATTCTTTACG 


101 


TGTTGAGTTT 


TAACAAATGT 


TTGTGGAGTG 


AATGAACAAA 


TTAATGAATA 


151 


TAGGCTATTT 


ATTAATTAGG 


CAATATAGTC 


ACATAGGCTG 


GCAATCGPAT 


201 


CTAATTA&AT 


AGAGTGGTAA 


ATGAGTTCCA 


G AAAG AAP T A 


APPTAPTAP A 


251 


AGGATGTTAT 


GAAAGAGAAA 


AATGAGTTAT 


GTGAAAAATA 


PP A P A P A P TP 


301 


ATAAGAGGGA 


AAGAATCCCA 


AAGTGTGGGC 


P A P A TTTTP A 
^-rtV— A 1X11 o A 


Zl 7i P""P 7\ » nr»p > 

nnL i AA IbAL 


351 


CTATTATTCT 


ATTATTGTTA 


GCTGAAAG TA 


PA A A APPTPA 


I A\jVj Lj AA 


401 


TATCTGCTAG 


TTTTTGGTAA 


AGG A TGTTGT 


P A TPP.P A P A A 




451 


AACACAAGGT 


GACTTTGGTT 


TGGGGACAGT 


PPP.ATA ATPA 


AC A L I LL 11^ 


501 


CTCCATCAGG 


GCCCCAGACT 


GGGCTCTGGC 

www x ^ X vwv 


apappaaptp 


ifiaBpaa np rp 

/4\j.rLrt.LAALL* i 


551 


AAAGACCTAG 


ATAGGTATCT 


AATAAATTGG 


GAPPTPTP A A 
<-ivji Onrt 


A APAPTPPPT 


601 


CTTAAAGTGT 


GGTACCTGGA 


CCAGCAGCAG 


P APP APP APP 


AbLLAJ. ItaAA 


651 


ACTTCATAGA 


AAGACAGATT 


CTCAGCTTCA 


TPP A A P A PTT 


AL I bAA X I Avj 


701 


AATATCTCAA 


GGTAAGGCCT 


GG T AATCTG A 


uLl x XAnLln 


LsLLL I LAALsts 


751 


TGATTCTTAA 


GTTCAAGCAT 


CACTATATTA 


APTTPA APA A 


AiAbAl bLLA 


801 


GGCCTATAAA 


TACATGTAAC 


GCCTAGCATA 


A A T A TTTP & & 


LAI xAAAAAl 


851 


GACATTTCAT 


AGTTC TT ATT 


TACCCTATTA 


PPTPTPTTP T 


Pfpp A IPS fPL TV 

\j 1 LAAbA x AA 


901 


TGAGAATATT 


GATATGTTAG 


AATACACTGA 


TGCACTAATT 

X ww/lw X X X 


■ TTT A A A TT* A P 
XIX r^rxrl 1 1 riv? 


951 


ATCAAATAAT 


GACTTGTTAT 


ACCTGAAATA 


AATTGG TTC A 

**** X X VJsJ X X 


PPTTPPT APA 


1001 


TGCAGTTTTT 


GAGAATTATA 


TAAGTCATTT 


TTAAAAGAAT 


AATTTTA A PT 

x x x x AnL x 


1051 


TGAGCTGCTT 


GCATAAATTA 


AATTGCAAAA 


AGG TC AT AG T 


A T A A A TP P TP 

*i X AAA J. L 


1101 


CTATTAGCAG 


AGATAGAAGG 


TTTTTAAAAA 


AATTACAGAT 


AAPTPTP A AP 


1151 


GTCTTTTAAA 


ATCTTATATT 


CAGGAAGTGA 


CTCGGGATGT 


ATATPATTTT 


1201 


AAAATACATG 


GTCTTAAATG 


TTGTAGTTGT 


ATGACTCTTT 


CAGTTAAT^T 

X X AA X ^ X 


1251 


AAAATACTTC 


CTTCTATGAA 


AAATTGTTTC 


AAAAATTTTT 


CTAAATTCTG 


1301 


TTATCCATTT . 


CAAGTAGGAT 


ACjG C AAGAAC 


AGATATAAGA 


TACTACTTTT 


13 51 


lloil LA 1 \j 1 


rT AC TAAAAA 


AAAAATT AC T 


GTAATTGAGA 


TCATGTAAAA 


1401 


ACATGTTTCC 


TGTCTATTTG 


TCTTAACCTT 


TTAATCCTGG 


CACCTTAAAT 


1451 


TTGACATAGT 


AGGAATTAGA 


AGACAATTGC 


AG AAAATG TC 


AACTGGGGAA 


15 01 


ATTTTATTCT 


ACTAAAAACT 


ATGTCCATAC 


AACATAGCAA 


ATCACATTTT 


1551 


AAAGGC C AAA 


AAGTCTTTCA 


T AG C AATTTT 


TCAGATTATT 


TTCAAAGCAT 


1601 


ATCTTCTCTC 


TGCTCCTGCA 


GCATGCCGTT 


GATTTTTCTG 


TTATGCAGTC 


1651 


ACATAAGTAA 


TTACATGTTT 


ACATGTCTAT 


TTCACTCATA 


GAACACGAAA 


1701 


CAGTTAAATG 


TAGAATAATA 


TCCAATCCAT 


CTTTTTATCA 


CCAGTAGCTA 
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1751 


GCATACTGTA 


GGAACTCAAT 


AAATATATCA 


GATAAATTGT 


GGAAATAACC 


1801 


ATATCAGCTT 


ATAACATATA 


GAAATGTGAG 


TTTAAAAAGA 


AAACAATTAT 


1851 


ACATATGAAA 


AAATTTTTAT 


ACCATTTTTT 


TAAAGACCTT 


TCAGATGTCA 


1901 


TACAGTTTGG 


ACTTTTCCAG 


TGTTTCTTGT 


ATCATGAGAC 


AATAGTAGAC 


1951 


ATTGTAAATC 


AAAAATAGTT 


TTCTGGGGTT 


GTGTACATTT 


GAAAAAACTG 


2001 


AATATCATAT 


CTGTTCTTAG 


AGAGTAATGA 


TGGATATTAA 


CATATCAAAG 


2051 


GXACAGAGAA GTCTTAAAGT 


TCAAAGTAAC 


ATCTGCTTAA 


TTGTATTTAA 


2101 


TTCAGTGCTC 


CATGAGCTTT 


TTTATCACTG 


ATTCCCTCCC 


TTTTTTCTCT 


2151 


TATGATAATA 


ATTAAC TTGT 


TCCTGTAGCA 


TTTTAAGAAA 


TGTTGATTTA 


2201 


GTTGAATGCC 


TTCACTTCTC 


CAATATAATA 


GCAGAAACTC 


AGAAATATTT 


2251 


ATTTACCCAG 


AATCATGCAG 


CTAATAGTAC 


AAGGATTCAG 


GTCTTTTACT 


2301 


TCCTATTTTG 


TGGTTCCCAA 


CTACTTTTGC 


CAAAGGTCTT 


TTAAATAATA 


2351 


TGAAACATAT 


TAGTGATTGA 


TTCATTATAG 


TAAATGGGTA 


AATGATAAGG 


2401 


CTTGCAATAA 


TTCACTGACA 


AGAAAGCTT 







Fig. 8 (Forts.) 



• ••• • • • 

* «•» • * • •••• 



66/77 



Maus cDNA-Secfuenz 

~f 7 

1 / . AAGCCAC AGCACCCTGGAGACAACCTTTGATACGACTGTG ACAACTGAAGTGAATGGAAG 
^-SHSTL ETTFDTTVTTEVNGR 

61 GGCCATCCCCAACCTGACAAGCCGACCTTCCCCCATGACCTGGAGACTGGGTCAAGCGTG 
AI P-NLTSRPSPMTWRLGQAC 

121 CCCTCGTCTACAGGCTGGAGATGCCCCCTCCATGGGCGCTGGATATTCTCGAAGCGGTAC 
P RL Q A G DA P SM. GAG Y S R S G T 

181 CAGCCGATTCATCCACACGGATCCCTCCAGGTTTATGTATACC ACGCCTCTCCGCCGAGC 

S *~*R FIHTDPSRFMYTT PLRRA 

2 41 TGCTGTCTCGCGTCTGGGAAACATGTCAC AAATAGATATGAGCGAGAAAGCAAGCAGTGA 

A V S R L G . N ■ M S Q I D M s E K A.S S D 

3 01 CCTGGATGTGTCTTCTGAAGTGGATGTTGGTGGATACATGAGCGATGGTGATATCCTTGG 
LDVS S EVDVGGYMSDGDILG 

) 6 1 GAAGAGTCTGAGAGCGGATGATATCAACAGTGGGTACATGAC AGATGGTGGGCTCAACCT 

KSLRADDIN SGY'MTDGGLNL 

421 ATATACCAGAAGTCTTAACCGAGTCCCGGACACAGCAACTTCCAGAGATGTCATACAGAG 
YTR S LNRV P DTATSRDV I QR 

4 81 AGGCGTTCACGATGTGACAGTGGACGCAGACAGCTGGGATGACAGCAGTTCTGTGAGCAG 

GVHDVTVDADSWDDSSSVSS 

541 TGGCCTCAGTGACACACTTGATAACATTAGCACAGATGACCTCAACACCACGTCCTCCAT 
G L S D T L DN I S TDDLNTT S S I 

601 CAGTTCTTACTCCAACATCACTGTCCCCTCCAGGAAGAACACTCAGCTGAAAACAGATGC 
SSYSNITVPSRKNTQLKTDA 

661* GGAGAAACGTTCGACAACAGATGAGACCTGGGATAGTCCTGAGGAGCTGAAGAAAGCCGA 
E K R S T TD E T W D S P E E L K K A E 

721 GGGAGATTGTGACAGCCATGGTGACGGAGCCGCCAAGTGGAAGGGTGCTACTTCTGGACT 
GDCDSHGDGAAKWKGATSGL 

7 81 TGCTGAAGACTCGGAGAAGACAGGGCAGAAAGCCAGCCTGTCTGTGTCTCAGACAGGCTC 
A -E D S • E K T G ~Q K A S L S V S Q T G S 

41 CTGGAGGAGAGGCATGTCTGCCCAGGGAGGAACTCCAGCTACAGCTAGGCAGAAAACCAG 
WRRGMSAQGGTPATARQKTS 



9 01 CACAAGTGCACTCAAGACCCCTGGGAAGACAGATGATGCCAAAGCTTCCGAGAAAGGGAA 
TSALKTPGKTDDAKASEKGK 

9 61 AACTCCTCTCAAAGGATCATCCTTGCAAAGGTCTCCTTCAGATGCAGGGAAAAGCAGCGG 
TPLKGSSLQRSPSD-AGK-SSG 

1021 GGATGAAGGGAAAAAGCC ACCGTCAGGCATTGGAAGATCGACAGCCAGCAGTTCTTTTGG 
DEGKKPPSGIGRSTASSSFG 

1081 ATACAAG AAGCCAAGTGGTGTAGGGGCTTCCACTATGATTACCAGCAGCGGTGCC ACC AT 
Y K K P SGVGASTMITS SG AT I 

1141 CACAAGCGGTTCAGCTACACTGGGGAAAATCCCCAAATCCGCTGCCATTGGTGGGAAGTC 
T S G S A T L G K I ? Y S A A I G G K S 

12 01" C AATG C A G G AAG G AAAA C C AG C C TGG A C G G G T C C 2 A.G AAT C AA G A. TG ATGTTGTCC TG C A 
NAG R - K T S L D G S QNQDD'VVL K 

12 61 CGTGAGCTCGAAGACCACCCTCCAGTACCGTAGTTTGCCCCGCCCTTCTAAGTCCAGCAC 

VSSKTTLQY.RSLPRP.SKSST 

13 21 CAGCGGAATCCCTGGGAGAGGTGGCCACAGGTCGAGCACCAGCAGCATTGATTCCAATGT 

SGIPGRGGHR'SSTSSIDSHV 
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13 81 CAGCAGCAAGTCAGCTGGGGCCACCACCTCCAAACTGAGAGAACCGACTAAGATCGGCTC 
SSKSA-GATTSKLREPTKIGS 

1441 AGGGCGCTCGAGTCCAGTC ACTGTCAACCAAACAGACAAAGAGAAGGAGAAAGTAGCAGT 
GRS S. PVTVNQTDKEKEK VAV 

15 01 GTCAGATTCAGAGAGCGTTTCCTTGTCAGGTTCCCCCAAATCCAGCCCCACCTCTGCCAG 

sdsesvsl'sgspkssptsas 

15 61 TGCCTGTGGGACTCAAGGGCTC AGACAGCCAGGGTCC AAATATCCAGATATTGCCTCGCC 

ACGTQGLRQPGSK YPDIAS P 

1621 CAC ATTTCGAAGGTTGTTCGGTGCCAAGGCAGGCGGCAAATCTGCCTCCGCACCTAATAC 
TFRRL FGAKAGGKSASAPNT 

16 81 TGAGGGGGCGAAGTCCTCCTCAGTAGTGCTC AGCCCTAGTACCTCTTTAGCCCGACAAGG 

EGAKS SSVVLSPSTSLARQG 



1741 CAGTCTGGAGTCACCGTCGTCCGGTACGGGAAGC ATGGGCAGTGCTGGTGGGCTGAGTGG 
SLESPSSGTGSMGSAGGLSG 



01 CAGCAGCAGCCCTCTCTTCAATAAACCCTCAGACCTAACTACAGATGTTATAAGCTTAAG 
SSSPLFNKPSDLTTDVISLS 



18 61 TCACTCCTTGGCTTCCAGCCCAGCGTCGGTTCACTCTTTCACATCCGGTGGGCTTGTGTG 

HSLASSPASVHSFTSGGLVW 

19 21 GGCTGCCAATCTGAGCAGTTCCTCTGCCGGCAGCAAGGACACTCCAAGTTACCAGTCCAT 

A A N L S S S S AG S KDTP SYQ SM 

19 81 GACTAGTCTCCATACGAGCTCTGAGTCCATTGACCTGCCCCTCAGCCATCATGGCTCCCT 
TSLHTSS'.ESIDLPLSHHGSL 

2041 GTCTGGACTGACCACAGGCACTCACGAGGTGCAGAGCCTGCTCATGAGAACGGGTAGTGT 
SGLTTGTHEVQSLLMRTGSV 

2101 GAGATCTACTCTCTCAGAAAGATACACCGCATCATCTCGGCAGGCCAACCAAGAAGAAGG 
RSTLSE-RYTPS SRQANQEEG 

2161 CAAAGAGTGGCTGCGATCGCATTCCACTGGCGGGCTGCAGGATACTGGCAACCAGTCTCC 
KEWLRSHSTGGLQDTGNQSP 

22 21 CTTGGTCTCCCCTTCTGCCATGTCA-TCGTCAGCCACCGGAAAATATCACTTTTCCAACTT 
LV S P SAM S S SATGKYHF S NL 

[281 GGTGAGTCCCACC AACCTCTCCC AGTTTAACCTGCCTGC ACCCAGTATGATGCGCTCCAG 
VSPTNLSQFNLPAPS. MMRSS 

23 41 CAGTATCCCCGCCCAGGACTCCTCCTTCGACCTCTATGATGATGCCCAGCTTTGCGGTAG 

S I PAQDS S FDLYDDAQ LCG S 

2 4 01 TGCAACTTCCCTGGAGGAAAGGCCACGGGCCGTTAGCCACTCCGGCTCATTCAGAGACAG 
ATSLEERPRAVSHSG SFRDS 

2 4 61 C ATGGAGGAAGTTCATGGCTCTTCACTGTCATTGGTCTCCAGCACATCATCCCTTTACTC 
MEEVHGSSLSLVSS-TSSLYS 

2 5 21 TACGGCTGAAGAGAAGGCTCATTCAGAGCAAATCCATAAGCTACGGAGAGAACTGGTTGC 
TAEEKAHSEQIKKLRRELVA 

2 5 81 CTCCCAGGAGAAAGTCGCTACCCTCACGTCTCAGCTGTCAGCAAATGCTCACCTTGTAGC 
S Q E KVATLT SQL S A N A H L V A 

2 5 41 AGCTTTTGAAAAGAGTTTAGGGAATATGACTGGCCGTTTGCAAAGTCTAACCATGACAGC 
AFEKSLGNMTGRLQSLTMTA 

2 7 01 GGAACAAAAGGAATCTGAGCTTATCGAACTGCGGGAAACCATTGAAATGTTGAAGGCCCA 
EQKESELIELRETIEMLKAQ 
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2 7 61 GAACTCTGCTGCCCAAGCAGCCATTCAGGGAGCACTGAATGGCCCAGACCACCCTCCCAA 
NSAAQAAIQGALNGPDHPPK 

2 821 AGATCTCCGCATCAGAAGACAGCACTCCTCTGAAAGTGTTTCTAGTATCAAC AGCGCAAC 
DL R I RRQH S S E SVS S I N SAT 

2 881 GAGCCATTCCAGCATTGGCAGTGGTAATGATGCTGACTCCAAGAAA 
S H S S I G S GNDA-DSKK 



Fig. 9 (Forts. 2) 
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Maus genomische Seguenz 

1 "gggatgaagg gaaaaagcca ccgtcaggca ttggaagatc gacagccagc 

51 agttcttttg gatacaagaa gccaagtggt gtaggggctt ccactatgat 

101 taccagcagc ggtgccacca tcacaagcgg ttcagctaca ctggggaaaa 

151 tccccaaatc cgctgccatt ggtgggaagt ccaatgcagg aaggaaaacc 

201 agcctggacg ggtcccagaa tcaagatgat gttgtcctgc acgtgagctc 

251 gaagaccacg ctccagtacc gtagtttgcc ccgcccttct aagtcc ag c a 

3 01 ccagcggaat cc ctggg ag a ggtggccaca ggtcgagcac cagcagcatt 

3 51 gattccaatg tcagcagcaa gtcagctggg gccaccacct ccaaactgag 

401 agaaccgact aagatcggct cagggcgctc gagtccagtc actgtcaacc 

451 aaacagacaa agagaaggag aaagtagcag tgtcagattc agagagcgtt 

501 tccttgtcag gttcccccaa atccagcccc acctctgcca gtgcctgtgg 

551 gactcaaggg c tc ag ac ag c cagggtccaa atatccagat attgcctcgc 

' 601 ccacatttcg aaggtaaggg tatgtaaaga gatgttggga aaacataaaa 

651 ggtagtatat agcatgtatt tattctgtac gaaactattt tcatgtattc 

7 01 taaatattct aagattctgt atcttatact, tgtctaaaat atagtgattt 

751 tattttgctg attgcacctg ttgctagtgt aaaagcattg ctcatttaga 

801 gagtggttag cctttcagct atacagccag tgtgacacta aaatacagat 

8'51 accacttgta gcgggcataa aaccacatga ctgactattc atagaaataa 

901 agtgatagct tgtaaagata tttagtgatt tccacctctc ctttccagaa 

951 ttaaaaaaag caaattgcat agatctttat aaacacattt acttctagtg 

1001 tatgttatct tgttgactct taatgaaatg gcagttatga atatagatga 

1051 tatattcttt ctaacagttt ataagagacc aatttataca gtaccagatc 

1101 ttaacatagt aacaataaca gcaacaaaaa caacccaaaa agctatcaaa 

1151 GTATGGTCTG ATTGCAGAAT TTGAAAACAT TTACATGTTT GACATAGGAC 

12 01 AAGAACTCAG GAGTGAGGTG ACTTTTTATA AGTCTTCATC AATGTCCTTT 

12 51 TACAGGAACC AGGAAGCATA TCTGATATAT GTGTCAGGAT TATCACTTTA 

13 01 TTAATTATGT GAAATTCTGT TT AG AAATCT ACCTGATTTT AAATAC TTT A 

13 51 AT AT AG T AGG GGTCAAAATT AGTTAATGAG TTAAGACAAG TTG TTAAAT A 

14 01 ATCCTGGCTC TGTTTTCTCA TCTTCAAAAT GATAGAGTAT AATTTATCAC 

14 51 CTCTTGTTAA ATATTTCAGG TTTGTGTTTA TTCTCTTGAT AACTTTGATC 

15 01 TCTTAGAAGA GTCTTGAAGA A TT T AC A T T A AGTAATCTTA GAAACATAAC 
1551 TATTTGAGAA ACAGTAGTCA AATTTTGTCA TTAGAAGTAT TAACTCTGAA 
1601 GAATGATTTG AAGTGACAGT TCTTAGAAAG AATAAATTAT AGCTTGTAGC 
1651 AAGAGTAAAT ATTTTCACTG CTTGTGTGAG AGCCAAGAGC GCCCTCTTGT 
17 01 GGCCCATTAC CTATGAAACA ATTTCTCATA TTCGCCCTAG AAATCTTCCA 
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1751 


CTGCAGGAAA 


TAATGGATTT 


CATTGCCTCT 


GAATTAGTAA 


CCATTCTGCC 


1801 


ATTTCTTCAT 


ACCATTTTAT 


TTCCATACTT 


GCATAAATTT 


GATTATGTCA 


1851 


TCTGCTTCAT 


TTACAAAACT 


AAAATGTTTT 


CTGAGCTAAA 


CTCCAGTAGC 


1901 


TAACTTAGTA 


CAAATGGTAT 


TTTTAAATCA 


CTGCTATAAG 


TATATATATT 


1951 


TGAATAGCTC 


TGGCAACGGA 


CGGAAATCCC 


TATGGTCTTT 


CCATGGGAAG 


2001 


ATACAAACC£ 


ATCCATAAGT 


TGTCCAGCAA 


TATCCAATAT 


TTCCAGCCCA 


2051 


GCSAGTCAGGv CCTCTTAAAC 


ATTACCTTAC 


ATATTTGAAC 


CTTTCCTTAA 


2101 


ATGTCCCCTT 


TAGACAATCT 


ATTTTTTAAA 


AAGATGAAAA 


TCCATTTAAG 


2151 


CATCATATAT 


CGAATGCGTA 


GAAGTTG TTT 


CATTATAATG 


GTTCTGCAGA 


2201 


TAGGTAATGC 


CAAAACGGCC 


AAAATATTTG 


ATCACTAGAA 


GCGTAAAAGT 


2251 


CAAGTACAAT 


CATGTTGACT 


TTTTTTC C AA 


GGTGGGTTCA 


CTGCTGCCCA 


2301 


CCTTGGTTCC 


AGGCCAGTGC 


TTACTTAAGA 


TATCGTAAGT 


GATTTTTTTT 


2351 


TAATTTTTAA 


TTTTTTAGTA 


GTTGG TTAAT 


CAAAAGCCAG 


TCATGTCACC 


2401 


TTCAGGAACA 


TAGAGGCTGG 


ACGTGCTTGG 


CAGCTCACGA 


CTCCAAAGCA 


2451 


CACTTGGCTC 


TGTGGACTGA 


AACCCTAGGA 


AACGTGGATG 


TGAGTCTCTT 


2501 


GGAACAACTC 


AAGTTGTTAT 


TTGTTTTTCT 


TTTAGGTTGT 


TCGGTGCCAA 


2551 


GGCAGGCGGC 


AAATCTGCCT 


CCGCACCTAA 


TAC 
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T2HC Homologe humane cDNA 

1 ggatcagcttcgggagaccatg^acaacatgcagttggaggtggacctgctgaaagcaga 
dqlr'etmhnmqlevdllkae 

61 gaatgaccgactgaaggtagccccaggcccctcatcaggctccactccagggcaggtccc 
ndrlkvap.gpssgstpgqvp 

121 . tggatcatctggattatcttccccacgccgctccctaggcctggcactcacccattcctt 
g s s a, l ' s s prrsl g lalth s f 

181 CGGCCCCAGTCTTGCAGACACAGACCTGTCACCCATGGATGGCATCAGTACTTGTGGTCC 
GPSLADTDLSPMDG-ISTCGP 

241 AAAGGAGGAAGTGACCCTCCGGGTGGTGGTGAGGATGCCCCCGCAGCACATCATCAAAGG 
KEEVTLRVV VRMPPQHI IK.G 



GGACTTGAAiSCAGCAGGAATTCTTCCTGGGCTGTAGCAAGGTCAGTGGAAAAGTTGACTG 
DL .K Q Q E F F LGCSKVSGKVDW 

GAAGATGCTGGATGAAGCTGTTTTCCAAGTGTTCAAGGACTATATTTCTAAAATGGACCC 
KML D E AV F Q VFKDY I S KMDP 



421 AGCCTCTACCCTGGGACTAAGCACTGAGTCCATCCATGGCTACAGCATCAGCCACGTGAA ' 

ASTLGLSTESIHGYSI SHVK 

4 81 ACGAGTGTTGGATGCAGAGCCCCCCGAGATGCCTCCTTGCCGTCGAGGTGTCAATAACAT 
RVLDAEPPEMPPCRRGVN'NI 

541 ATCAGTCTCCCTCAAAGGTCTGAAGGAGAAATGCGTCGACAGCCTGGTGTTCGAGACGCT 
SVSLKGLKEKCVDSLVFETL 

6 01 ' GATCCCCAAGCCGATGATGCAGCACTACATAAGCCTCCTGCTGAAGCACCGGCGCCTCGT 

I PK PMMQ HY I SL LLKHRR LV 

6 61 CCTCTCGGGCCCCAGCGGCACGGGCAAGACCTACCTGACCAATCGCTTGGCCGAGTACCT 
L S G P S G T..G KTYLT NRLAE Y L 

721 GGTGGAGCGCTCTGGCCGTGAGGTCACAGAGGGCATCGTCAGCACCTTCAACATGCACCA 
VERS GREVTEGIVSTFNM-HQ 

GCAGTCTTGCAAGGATCTGCAACTGTATCTTTCCAACCTAGCCAACCAGATAGACCGGGA 
QSCKDLQLYLSNLA-NQIDRE 

841 AACAGGAATTGGGGATGTGCCCCTGGTGATTCTATTGGATGACCTGAGTGAAGCAGGCTC 
TGIGDVPLVILLDDLSEAGS 

9 01 CATCAGTGAGTTGGTCAATGGGGCCCTCACCTGCAAGTATCATAAATGTCCCTATATTAT 
I SELVNGALTCKYHKCPY I I 

9 61 AGGTACCACCAATCAGCCTGTAAAAATGACACCCAACCATGGCTTGCACTTGAGCTTCAG 
GTTN Q PVKMTPNHGLH L S .F R 

1021 GATGTTGACCTTCTCC AACAACGTGGAGCCAGCCAATGGCTTCCTGGTTCGTTACCTGAG 

M L T F S N N V EPANGFLVRYLR 

1081 GAGGAAGCTGGTAGAGTCAGACAGCGACATCAATGCCAACAAGGAAGAGCTGCTTCGGGT 
RKLV E S D S D I NANKEE L L RV 

1141 GCTCGACTGGGTACCCAAGCTGTGGTATCATCTCCACACCTTCCTTGAGAAGCACAGCAC 
LDWVPKLWYHLKTFLEKKST 
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12 01 CTCAGACTTCCTCATCGGCCCTTGCTTCTTTCTGTCGTGTCCCATTGGCATTGAGGACTT 
SDFLIGPCFFLSCP IGIEDF 

12 61 CCGGACCTGGTTCATTGACCTGTGGAACAACTCTATCATTCCCTATCTACAGGAAGGAGC 

RTWFIDLWNNSI IPYLQEGA 

1321 CAAGGATGGGATAAAGGTCCATGGACAGAAAGCTGCTTGGGAGGACCCAGTGGAATGGGT 
KDG I KVHG QKA AWEDPVEWV 

13 81 CCGGGACACACTTCCCTGGCCATCAGCCCAACAAGACCAATCAAAGCTGTACCACCTGCC 

RDT .L, PWPSAQQDQSKLYHLP 

1441 CCCACCCACCGTGGGCCCTCACAGCATTGCCTCACCTCCCGAGGATAGGACAGTCAAAGA 
PPTV GPHSI AS PPEDRTVKD 

15 01 CAGCACCCCAAGTTCTCTGGACTCAGATCCTCTGATGGCCATGCTGCTGAAACTTCAAGA 
STPSS LD SDPLMAMLLKLQE 



AGCTGCCAACTACATTGAGTCTCCAGATCGAGAAACCATCCTGGACCCCAACCTTCAGGC 
AANY I E S PDRETI LDPNLQA 

AACACTTTAAGGGTTCGGCAATCACTGTCACCCCCGGACAGCAGAACGCTGGCATCAGCT 
T L * 



1681 ■ ATCTTAGCTCCTCCTCTCCCCTCTCCTCTTTCAGAGCACTGGCTCTCCAGCCCCAGGAGG 

17 41 AGAACAGGAGGGAGGAGGAGATGAAAGAGGAGGGACAGGTTCTTGGTGCTGTACCTTTGA 

1801 GAACTTCCTAGGAAGGAATGGTGGGGTGGCGTTTGGGAACTTGTGCCCCCTAAACACATT 

1861 TACTGGCCTCCTCTAATGACTTTGGGGAAAAGATGATTCTGGGTCTTTCCCTTGACTTCT 

1921 TGTTTCAATTACAAACTCCTGGGCTTTCTGGGGAGGGGTTCAGAAAACATCAAAACACTG 

1981 CAGC AGTTCCTAAATG ATTCTCACAAGCAACCCTGAGAGAGACAGTCTTGTGAGGGAGAT 

2 041 CTGGGGGAGGCAGGAAGCTCCTCAGATTTTCTCACAGACCCTTCCCAATTCCATCACCAC 

2101 TGCCAACAACTCCTCCCCCAGAGATCTGGCTGGAGCCCAGAAAAAGAAGCATGTGGTTTA 
AAAAATGTTTAAATCAATCTGTAAAAGGTAAAAATGAAAAACAAAAACAAGCAAACAAAC 
AAAAAACAATGGAAAAGATGAAGCTGGAGAGAGAGGAACCAGTTGCCAAGGTAGAGAGCT 

22 81 GCCCGCTCCTGCCCTCTGGATGACATAGGGGACATCAACAAGACGGCTGCCAACCTGAGA 

2341 AGTCACCAAACCACAAAAATAACCTTACAGCCTTCAGGGAAAGACTACCAGCTCTGTCTT 

24 01 TCTACCCTCTAATTTAACAATGCATAAGAGTCAATAAACCCTACTTTTTTAAAAAAAAAA 
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Homology Maus cDNA-Seguenz 



1 T gaactatgggaaaaagagatgaag'ctcacggatatccggttggaggccctcaactctgcc - 1 

LELWE K EMK-LTD I RLEALNSA 
6 1 CACCAGCTGGACCAGCTTCGGGAGACCATGCACAATATGCAGTTGGAGGTGGACCTGCTG 

hqldqlretmhnmqlev.dll 

121 aaagcagagaatgaccggctgaaggttgcccccggcccctcctcaggctgcactccaggg 
kae'nd rlkvapg pssgctpg 

181 CAGGTCCCTGGGTCATCGGCTCTGTCGTCCCCTCGACGTTCCCTGGGCCTTGCACTCAGC 
Q-VPGSSALSSPRRSLGLALS 

241 CATCCTTTCAGTCCTAGTCTCACAGACACAGACCTCTCACCCATGGATGGCATCAGCACC 
HPFS PSLTDTDLSPMDGIST 

3 01 TGTGGTTCAAAGGAAGAGGTGACCCTGCGGGTGGTGGTCCGGATGCCGCCCCAGCACATC 

CG S K E EV TL RVVVRM P PQH I 

m61 ATC AAAGGGGACTTAAAGCAGCAGGAGTTCTTCCTGGGTTGCAGCAAGGTCAGTGGCAAA 
W IKGDLKQQEFFLGCSKVSGK 

421 GTTGACTGGAAGATGCTGGATGAAGCCGTTTTCCAAGTGTTCAAGGACTACATTTCTAAA 
VDWKMLDEAVFQVFKDYIS K 

4 81 ATGGACCCAGCCTCAACCCTGGGACTGAGCACTGAGTCCATACATGGCTATAGCCTCAGC 

MDPASTLGLSTESI HGYSLS 

541 CACGTGAAACGAGTGCTGGATGCTGAGCCCCCAGAGATGCCTCCTTGCCGCCGAGGTGTC 
HVKRVLDAEPPEMPPCRRGV 



601 AATAACATATCAGTCGCTCTCAAAGGTCTGAAAGAGAAGTGTGTCGACAGCCTGGTGTTC 
NNISVALKGLKEKCVDSLVF 

661- GAGACGCTTATCCCCAAGCCCATGATGCAGCACTACATCAGCCTCCTGCTCAAGCACCGG 
ETLI PKPMMQHYISLLLKHR 

721 CGCCTGGTGCTCTCCGGCCCCAGTGGCACCGGCAAGACCTACTTGACCAATCGGCTAGCC 
RLVLS'GPSGTGK.TYLTNRLA 

7 81 GAGTACCTGGTGGAGCGCTCCGGCCGCGAGGTCACGGATGGCATCGTCAGCACTTTCAAC 
EYLVERSGREVT DGIVSTFN 

^841 ATGCACCAGCAGTCTTGCAAGGATCTGCAACTGTACCTCTCCAACCTAGCCAACCAGATA 
MHQQSCKDLQLYLSNLANQI 

9 01 GACCGGGAAAC AGGGATAGGGGATGTGCCCTTGGTGATCCTCCTGGATGATCTGAGTG AA 

DRETGIGDVPL'VILLDDLSE 

9 61 GCAGGCTCCATCAGTGAGCTGGTCAATGGGGCCCTCACCTGCAAGTATCACAAATGTCCC 

AGSI SELVN GALTCKYHKCP 

1021 TACATTATAGGTACCACCAATCAGCCTGTAAAAATGACACCCAA'CCATGGCTTGC ACTTG 
YI IGTTNQPVKMTPNHGLHL- 

10 81 AGCTTCAGGATGCTGACCTTCTCGAACAATGTGGAACCAGCCAATGGCTTTCTGGTCCGT 

SFRMLTFSNNVEPANGFLVR 

1141 TACCTGCGGAGGAAGTTGGTAGAGTC AGACAGTGACGTCAATGCTAACAAGGAAGAGCTG 
YLRRKLVESDSDVNA..NKEEL 



12 01 CTTCGGGTGCTGGACTGGGTGCCCAAGCTGTGGTATCACCTCCACACCTTCCTGGAGAAG 

LRVLDWVPKLWYHLH.TFLEK 

1261 CAC AGC ACCTCGGACTTCCTCATTGGCCCTTGCTTCTTCCTGTCCTGTCCCATTGGCATC 
HSTSDF LIGPC FFLSCPIGI 

13 21 GAGGACTTCCGGACCTGGTTCATTGACCTGTGGAACAATTCCATCATCCCCTATCTACAG 

ED-FRTWFIDLWNNSIIPYLQ 
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13 81 GAAGGAGCCAAGGATGGGATC AAGGTTCATGGACAGAAAGCTGCTTGGGAAGACCCGGTG 
EGAKDG I KVHGQKAAWEDPV 

1441 GAATGGGTCCGAGACACTCTTCCCTGGCCGTCGGCCCAAC AAGACC AATCAAAGCTCTAC 
EWVR DTL PWPSAQQDQSKLY 

1501 CACCTGCCCCCGCCTTCTGTGGGCCCCCACAGCACTCjCCTCACCCCCGGAGGACAGGACA 
HLPPPSVGPHSTASPPEDRT 

1561 GTCAAAGACAGCACTCC AAACTCCCTCGACTCAGATCCCCTGATGGCCATGCTACTGAAA 
V KDS^TPNSLDSDPLMAMLLK 

1621 CTCCAAGAAGCTGCCAACTACATTG AGTC ACC AGATCGAGAGACTATCCTGG ACCCCAAC 
LQEAANYIESPDRETILDPN 

1681 CTCCAGGCGACACTCTGAGGGCCCGGCAGTCACTGTCACCCTGGAGGGCAGAAGGCTGGC 
L Q A T L * 



1741 TTCAGCATC ATTAGCTCTCCTCTGCCCTCTTCCTTCATAGCTCTGGCTC ACC AGCCTCGC 

01 CAAGAGAACAGGAGGGAAGAAGAGGGCAGGAGGAGGGATGGGTTCTCGGTGCTGAACCTT 

8 61 TGAGAACTTCCTACTAGGAATTGGAGGGGGTGGAGTTTGAG AACTCCGTGCCCCTTAACT 

1921 AC ATTTGCTGGCCTCCTCTTACGACTTAGG AGAAAAGATGATTCTGGTCTTTTCTTC AAG 

19 81 TTTTGTTTC ACCTACAAACTCTTGGGCTTTCTGGGGAGGGATTCGGAAGATATAAACAGA 

2 041 C AAAC AAAAAC AAAC AAACC AACTAC AGC AG TTCC AAG C TC G TTC TC AC AAAC ACCTCTG 

2101 AGACAGTCACATGTGGGCAAATCTAAGGGAGGCAGGAAGCTCTACAGACTTTCTTGCAAA 

2161 CCCTTCCCAGTTCTGTCGACACTGCCAACAACCTCCCCGCCAGAGACCTGGCCAGAGCCA 

2221 AGAAAAGAGAAGC ATGTGGTTTAAC AGAAAAACAAAACAAAAC AAAACAAAAAATATATG 

22 81 TGTAAATCAACCTGTAGAAGGTAAAAACGGCAATGGAAAAGATGAAGCTGGAAGGAGGGG 

23 41 CCCAGTTGCCAAGATGGAACGAGAGCTGCCAGATCTTGCCTTCTGGATGACAAGAGGGGA 
2 401 CATTGCAAGATGGCTGCCAGTCTAAAACGTCACCAGACCACAAGAGTAACATCACAGCCT 
2 461 TCGAAGAAAGGCCACAAGCTGTCTTTCTGCCCTCTAACTGAACATGCATGAAAAGTCAAT 

521 AAAC C C TAC TTTTTAATTTTTAAAAAAAAAAAAAAAAAAAAAAAAAAA 
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1 CCAATAGAACTCCGGATCAAGAGGCAGAATTCCTCAGATAGCATCTCCAGCCTCAACAGC 
— P IELRIKR- QNSSDSISSLNS 

61 ' ATCACCAGCCATTCCAGCATCGGC AGCAGCAAAGATGCTGATGCCAAGAAGAAAAAGAAG 
ITSHSSIGSSKDADAKKKKK 

121 AAGAGTTGGGTATGTAAAGGCTTGGGGATCGGCCTGTGCTAGG AGTC ACTC ACCCTGTTG 
KSWVCKGLGIGLC* 

181 CAGGGAACTGACCCCTTTCAGGATCAACAAAGAGGGTCCCTTCTAACAGGATGCCAGTGT 

241 TGTGACATCTGCTGGGGACAAAAATTCACTAAGTTCCCATTCCTCTATCCATTGTCTATT 

301 CTCCTTACCACCGCCCTGCACATATACCCCAGCCCCCCACCGTCCCTGCATCCTTTATAC 

361 AT^TCTGCTATCCTGGGGCTCTACCTACTGATGAGGTCAAATGTATTTGGCCGTAGAAGG 

4 2 1 ~~ AGCTGAGAAAATTATTCATGGGTGGGAGAGTGGGGCATGTGGAGAGAATTTGTAAGCCAA 

431 GCAGGGTACTCTAGACGCTCCTGGGGCTGTTGCTTTAGTTTGGGTGAGGAGGCTGTGGAA 

541 CGTCCCC ATCGCTCCAAAGCCTGCTTTTGTCTGGTCCAGAGGTGGGTTTGTTCTGTGTGG 

601 TATCCCCCCTGTAACTCTAAACTGGCTTTGGGTGAGCTTTCTACAATCTGTACGCAGGTG 

661 TAGGGCACTGCCTGACTGACTGAAAGGGAGAGTGACCCAGAGTGAGCGTCTTGTCCCTGT 

721 CCCTGCTGAGGAGGGCTGGCTACAGACTTTGGCCTAGTGCAGACAGGAGCCAGCTGTGTG 

781 GAGAAGCAGCTGTGTGAAATGCATGAGTAGTGTCGCTGCTGCTGCTG.CTGCTGCTTTCTT 

841 TTCATTGTTTTTTTTTTTTTTTCTTTC CTTTTATTTCCTTC AAAATGCTGACCTC AAATC 

9 01 CCTATTTTTTTTCCAGGTTTATGAGGTAAGAAACTCGGTTCCTCTCCTCGTGCTTTTTCT 

961 TTCCCTTTGCACACCTTCGTGTTTCCAGAGCAAGCACCTCTCTTAAAAAAAAAAAAAAAA 

1021 AAAAA 
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Spleifivariante 1 (JFC410) 

~ ■ J ra a tj X A y 

241 AA 

* 

bp 1 er.tsprich.- bp 914 von THC 

£5*" strichene Setpienz: reprassnciert weitere Sple.fiform u-d ,^hr • 

TKC-Seqpuenz gezeigt ^ y-m u*.a is t niche in 
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SpleiSvariante 2 

1 V GGCAC?CACGAGGTCCAGAGCCTGC^CATGAGAACGGGTAGTGTGAGATCTACTCTCTCA 

GTHEVQSLLMRTGSVR3 T.LS 

5 1 GAAAGATATACCCCATCATCTCGGCAGGCCAACCAAGAAGAGGGCAAAGAGTGGTTGCGT 
HH^.Y T P S S RQA NQEEG K 3 W LR 

121 TCTCATTqTACTGGAGGGCTTCAGGACACTGGCAACCAG 
S K S,TG GLQDTGNQ 



bp 1 entspricht bp 3 3 00 von THC- 



unterscrichene Basenpaare -> Posi-ion des dif f arentiell aes^leiSten Exons, 
.das hier f ehl u , aber in THC-Sequenz gezeigr ist. 
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